Microsoft udostępnia aplikację mobilną Seeing AI, która ma pomóc użytkownikom niedowidzącym
Podczas Microsoft Skill Summit firma Microsoft udostępniła aplikację mobilną Seeing AI na urządzenia z systemem Android i Apple.
Ta mówiąca aplikacja pomaga osobom niedowidzącym dostrzegać otaczający ich świat poprzez czytanie tekstu, opisywanie scen i identyfikację osób, obiektów, kolorów i walut przy użyciu technologii Azure AI.
Technologie sztucznej inteligencji często wymagają wydajnych komputerów do analizowania monitów użytkowników i reagowania na nie, a niewiele urządzeń mobilnych jest wyposażonych w chipy AI, takie jak Snapdragon 8 Gen 3 w najpopularniejszych smartfonach z 2024 r. Dlatego też większość monitów jest przekazywana do usług online, takich jak OpenAI (ChatGPT) lub Microsoft (Azure AI, CoPilot), gdzie żądania są obsługiwane przez wydajniejsze komputery w chmurze.
Microsoft Seeing AI wykorzystuje Azure GPT-4 Turbo z Vision AI, aby umożliwić reagowanie i dokładne odpowiedzi na dowolnym smartfonie wyposażonym w następujące funkcje:
- Zamiana tekstu na mowę – aplikacja odczytuje wyświetlony tekst.
- Krótszy tekst można odczytać w trybie kamery na żywo, dłuższy tekst jest fotografowany, konwertowany na tekst i na koniec czytany na głos.
- Czytnik kodów kreskowych – aplikacja wyszukuje produkty na podstawie kodu UPC.
- Scena – aplikacja opisuje scenę, którą widzi, skupiając się na najbliższym obiekcie.
- Osoba – aplikacja opisuje osobę, którą widzi, identyfikując emocje na jej twarzy.
- Waluta – aplikacja identyfikuje rachunki, które widzi w 17 krajach.
- Kolor – aplikacja identyfikuje kolor w środku zdjęcia na żywo.
- Pismo odręczne – aplikacja konwertuje odręczne notatki na tekst.
- Jasność – aplikacja emituje dźwięk o różnej wysokości w zależności od jasności.
Aplikacja jednak nie jest tak kompetentna w opisie jak człowiek. Na przykład Seeing AI poprawnie identyfikuje maszynkę do golenia w puszce, ale nie jest w stanie zidentyfikować sortownika monet.