«Наш ответ GPT»: Google представила ИИ-модель Gemini
Google запустила, по собственной оценке компании, самую большую и «наиболее способную» модель искусственного интеллекта (ИИ) Gemini, которая, опять же по оценке Google, превосходит GPT-3.5 от OpenAI. «Gemini — это результат масштабных совместных усилий команд по всей Google, включая наших коллег из Google Research», — написал 6 декабря генеральный директор компании Сундар Пичаи в корпоративном блоге.
Google запустила, по собственной оценке компании, самую большую и «наиболее способную» модель искусственного интеллекта (ИИ) Gemini. Новая большая языковая модель будет включать три варианта с разным масштабом решаемых задач: наиболее мощная Gemini Ultra; Gemini Pro (для широкого спектра задач) и Gemini Nano (для конкретных задач и мобильных устройств).
Google, в частности, продемонстрировала, что Gemini может сделать скриншот диаграммы, проанализировать сотни страниц исследования, а затем обновить диаграмму на основе анализа. Другим примером ее работы был анализ фотографии домашнего задания по математике, определение правильных ответов и указание на неправильные.
- Читайте также:
- Google позволит скрыть личную информацию пользователя из результатов поиска
- Исследование: новый чат-бот от Google охотно цитирует конспирологические теории и фейки
- Google тестирует ИИ, способный писать новости, но о замене журналистов речь не идет
В сообщении компании в корпоративном блоге отмечается, что Gemini Ultra — первая модель, которая превосходит экспертов-людей по массовому пониманию языка в многозадачном режиме (MMLU) — использует комбинацию из 57 направлений знаний, таких как математика, физика, история, юриспруденция, медицина и этика. Вероятно, она сможет понимать нюансы и рассуждать по сложным предметам, полагают в компании.
«Gemini — это результат масштабных совместных усилий команд по всей Google, включая наших коллег из Google Research», — написал генеральный директор компании Сундар Пичаи в блоге. По его словам, новый ИИ «был создан с нуля как мультимодальный»: он может обобщать и легко понимать, оперировать и комбинировать различные типы информации, включая текст, код, аудио, изображения и видео. «Эта новая эра моделей представляет собой одно из крупнейших научных и инженерных достижений, которые мы предприняли как компания», — отметил Пичаи.
«Детали», Ю.Л. Фото: Pixabay
Будьте всегда в курсе главных событий:
