Сбер существенно обновил лингвистические возможности своей нейросети GigaChat: теперь ИИ понимает более 30 национальных языков. Обновление, подготовленное при участии ученых и носителей речи, позволит пользователям искать информацию и работать с документами на родном языке.
В список поддерживаемых наречий вошли татарский, башкирский, чувашский, чеченский, якутский, бурятский и другие языки. Для обучения системы Сбер привлек экспертов из Дома народов России, команды интернет-энциклопедии «Рувики», а также специалистов региональных академий наук и профильных фондов.Обучение на живой речи
Базой для обучения послужили миллионы документов: от архивных текстов и научных работ до современных новостных материалов. Особенностью проекта стало участие носителей языка, которые вручную проверяли корректность грамматики и соответствие ответов естественной речи. Разработчикам удалось адаптировать алгоритмы так, чтобы нейросеть выдавала качественный результат даже при ограниченном объеме данных. Теперь GigaChat одинаково хорошо распознает как строгий литературный слог, так и разговорный стиль.

Комментарии (0)
Пока нет комментариев. Будьте первым!