ゆるサイバーダイン
用語集
ゆる勉強メモ
図鑑
カレンダー
ロボ診断
☰
← 用語集一覧に戻る
マルチモーダルAI
(Multimodal AI)
ソフト・AI
マルチモーダルAIは、文字・画像・音声・動画など複数の種類のデータを同時に扱えるAIのことです。 「写真を見せて『これは何?』と質問する」「動画を見て要約する」といった使い方ができます。 フィジカルAIでは、カメラ映像・音声指示・センサー情報を統合してロボットを動かすために必須で、VLAモデルもマルチモーダルAIの一種です。
関連動画を見る
関連用語
VLAモデル
生成AI
Transformer
ロボット基盤モデル
関連する機体
Optimus
Figure 03