ゆるサイバーダイン
← 用語集一覧に戻る

マルチモーダルAIMultimodal AI

ソフト・AI
マルチモーダルAIは、文字・画像・音声・動画など複数の種類のデータを同時に扱えるAIのことです。 「写真を見せて『これは何?』と質問する」「動画を見て要約する」といった使い方ができます。 フィジカルAIでは、カメラ映像・音声指示・センサー情報を統合してロボットを動かすために必須で、VLAモデルもマルチモーダルAIの一種です。
関連動画を見る

関連する機体