Najnowsza wersja Groka firmy xAI może przetwarzać obrazy
xAI, konkurent OpenAI założony przez Elona Muska, przedstawił pierwszą wersję Grok, która może przetwarzać informacje wizualne.
Grok-1.5V to multimodalny model sztucznej inteligencji pierwszej generacji, który może przetwarzać nie tylko tekst, ale także „dokumenty, diagramy, wykresy, zrzuty ekranu i zdjęcia”. W ogłoszeniu xAI podała kilka przykładów wykorzystania swoich możliwości w świecie rzeczywistym. Użytkownik może na przykład pokazać mu zdjęcie schematu blokowego i poprosić Grok o przetłumaczenie go na kod Pythona, poprosić go o napisanie historii na podstawie rysunku, a nawet poprosić o wyjaśnienie mema, którego ktoś nie może zrozumieć.
Nowa wersja pojawia się zaledwie kilka tygodni po tym, jak firma zaprezentowała Grok-1.5. Model ten został zaprojektowany tak, aby był lepszy w kodowaniu i matematyce niż jego poprzednik, a także aby był w stanie przetwarzać dłuższe konteksty, dzięki czemu może sprawdzać dane z większej liczby źródeł, aby lepiej zrozumieć niektóre zapytania. xAI powiedział, że jego pierwsi testerzy i obecni użytkownicy wkrótce będą mogli cieszyć się możliwościami Grok-1.5V, chociaż nie podał dokładnego harmonogramu jego wdrożenia.