Gadget Stream Online

ChatGPT搭載ロボット登場か? Figureのデモが公開

gds-master + AI

「gdsマスター」は出版業界で編集者のキャリアを経て、コンテンツ制作の仕事をしている記事制作の専門家です。記事はAIによる自動生成ではなく、「gdsマスター」の手によるキュレーションと編集、AIとコラボレーションした執筆によって制作・配信しています。

3月13日、米国のAIIロボティクスベンチャーFigureは、ChatGPT搭載のロボットの動画デモを公開しました。

Figure Status Update - OpenAI Speech-to-Speech Reasoning

Figure 01は、OpenAIとのパートナーシップによって注目を集めている新しいタイプのヒューマノイドロボットです。このロボットは、一般的な作業を行うために設計されており、人間と同様の身体構造と機能を持ち、日常の環境での作業が可能です。Figure 01は身長168センチメートル、重さは60キログラムで、最大20キログラムの荷物を持ち上げることができます。また、1回の充電で最大5時間稼働することが可能です。

そこで動画として公開された内容が、ちょっと面白いです。

「今、何が見えますか?」という質問に対して、Figure 01は「テーブルの中央にお皿に乗った赤いリンゴ、カップとお皿が乗った水切りラック、そしてあなたがテーブルに手を置いて近くに立っているのが見えます」と解説。

更に、「何か食べ物をもらえますか?」という質問に、Figure 01は「食べ物」である「リンゴ」を指示者に手渡しています。

なぜそうしたのかと質問すると、「テーブルにある食べられるものはリンゴだけだったので、それをあなたに渡しました」と答えています。これは、意味をきちんと理解した回答ですね。

さらに「今の状況から判断すると、目の前の食器は次にどこに行くと思いますか?」という問いに対しは、「テーブルの上のお皿やカップは、次に水切りラックに入ると思います」と回答して実行します。

https://youtu.be/gEjXcEU3Bbw?si=skidPrHMNF3-vVdK

FigureのシニアAIエンジニア、コーリー・リンチ氏は、Figure 01が「視覚体験を説明し、行動を計画し、記憶を振り返り、推論を言葉で説明する」能力を持つとしています。プロジェクトでは、ロボットのカメラからの画像と、搭載されたマイクによって捉えた音声のテキストを、OpenAIによって訓練されたマルチモーダルモデルに提供することで認識しています。

実際のデモ動画を見ても、「人間らしさ」を備え始めたFigure 01は、実用化が楽しみですね。

参照元:beincrypto

監修者のコメント:YouTube動画と記事の内容からまとめました