Компанія Meta спільно з ЮНЕСКО оголосила про запуск програми, спрямованої на розширення можливостей штучного інтелекту в галузі мовного розпізнавання та перекладу. Проект покликаний зібрати мовні записи, транскрипції та перекладені тексти для навчання відкритих ШІ-моделей.
Мета проекту та його учасники
Meta планує залучити до співпраці різні організації, установи та мовні спільноти, які можуть надати великі обсяги аудіозаписів, письмові тексти та паралельні переклади різними мовами. Компанія наголошує, що всі зібрані дані будуть використані для покращення моделей розпізнавання мов та перекладу. Розроблені нові алгоритми будуть відкритими для спільного користування.
Одним із перших партнерів став уряд Нунавуту – автономної території Канади, де мешкає корінне населення, що розмовляє мовами інуктут. Ці мови мають обмежене цифрове представлення, тому ініціатива може стати важливим кроком у їх збереженні та популяризації.
Паралельно з цим компанія Meta анонсувала випуск еталонного тесту машинного перекладу з відкритим кодом для оцінки продуктивності мовних моделей. Набір тестових речень, створених професійними лінгвістами, підтримує сім мов, а доступ до нього відкритий через платформу Hugging Face.
