Przejdź do treści

Multimodal artificial intelligence

Multimodalna sztuczna inteligencja – Podejście do sztucznej inteligencji, które uwzględnia wiele typów danych. Na przykład model zamiany mowy na tekst, który jest zwykle szkolony na danych dźwiękowych i tekstowych, może obejmować dane obrazu ruchów warg pobrane z nagrań wideo. Multimodalna sztuczna inteligencja może łączyć zarówno dane liczbowe, takie jak ciśnienie krwi, tętno, jak i dane obrazowe, takie jak tomografia komputerowa.