BTC $81,852 ▼ 0.298% ETH $2,343 ▼ 1.298% BNB $669 ▲ 0.569% SOL $98 ▲ 1.434% BTC $81,852 ▼ 0.298% ETH $2,343 ▼ 1.298% BNB $669 ▲ 0.569% SOL $98 ▲ 1.434%
Альткоины

Новые релизы Google

Обновление корпорации Google Gemini 3.1 Flash TTS

Вот что нового в этой обновлённой модели синтеза речи 🚀! Теперь она поддерживает более 70 языков и отличается улучшенным качеством звука и более точным управлением.

Голосовой ИИ-интерфейс 📊 становится все более доступным, и разработчики, компании и пользователи могут создавать приложения с голосовым интерфейсом.

Gemini 3.1 Flash TTS уже доступна:

для разработчиков — в режиме предварительного доступа через Gemini API и Google AI Studio;

для предприятий — в Vertex AI;

для пользователей Workspace — через сервис Google Vids.

Улучшенное качество речи и управляемость 📉 Модель набрала 1211 баллов в рейтинге Artificial Analysis TTS Этот показатель сформирован на основе предпочтений тысяч респондентов, принимавших участие в слепом тестировании качества аудио.

Компания Artificial Analysis отнесла модель к группе наиболее привлекательных решений благодаря сочетанию высококачественного синтеза речи и низкой стоимости 💰.

LLM выделяется способностью генерировать естественные диалоги с участием нескольких спикеров ⚡.

Новые аудио-теги 🐋 В версии 3.1 Flash TTS появились аудио-теги — инструмент для управления стилем, темпом и манерой речи.

«Первые разработчики и корпоративные тестировщики уже видят результаты работы 3.1 Flash TTS, отмечая ее впечатляющую управляемость и выразительность

Они рассказали нам, как аудио-теги обеспечивают новый уровень творческой точности, превращая простой текст в высококачественное голосовое исполнение», — говорится в блоге компании.

ИИ-модель для робототехники 💻 Параллельно с Gemini 3.1 Flash TTS корпорация Gemini Robotics-ER 1.6 Эта ИИ-модель призвана обеспечить роботов возможностью выполнять сложные задачи в реальных условиях за счет улучшенных когнитивных функций и «воплощенного» мышления.

Нейросеть специализируется на пространственном восприятии, планировании действий и оценке их успешности

Она демонстрирует заметные улучшения по сравнению со своей предшественницей и Gemini 3.0 Flash при выполнении заданий, связанных с пространственным и физическим мышлением.

Gemini Robotics-ER 1.6 может интерпретировать данные со сложных измерительных приборов и наблюдать показатели через смотровые стекла Эту возможность специалисты Google DeepMind разработали совместно с Boston Dynamics для нужд промышленного сектора.

«Такие возможности позволяют автономно видеть, понимать и реагировать на реальные вызовы», — прокомментировал вице-президент проекта Spot в Boston Dynamics Марко да Сильва.

В тестах на выявление угроз безопасности новинка превзошла Gemini 3.0 Flash на 6% в текстовых сценариях и на 10% при анализе видео.

Интеграция LLM в реальные рабочие процессы уже началось: Boston Dynamics интегрировала Gemini и Gemini Robotics-ER 1.6 в собственную платформу Orbit AIVI-Learning.

Gemini на macOS 🖥 Кроме того, Google нативное приложение Gemini для macOS

Оно доступно по нажатию Option + Пробел Среди функционала — возможность поделиться окном для мгновенной передачи контекста.

Приложение поддерживает генерацию изображений с помощью Nano Banana, создание видео с Veo и другие привычные инструменты.

Gemma 4 — новое семейство открытых ИИ-моделей для продвинутых рассуждений и агентных рабочих процессов.


По материалам ForkLog

Криптобиржи с ИИ Круг видит шанс для юань-стейблкоина