Поддержать нас
Беларусы на войне
  1. Помните «непростого» иностранца, который в 2020-м хвалил Лукашенко и говорил, что никто не украдет его дом? Похоже, он «сглазил»
  2. Самый востребованный в мире беларусский бестселлер перевели на английский язык
  3. В обменниках возникла «аномальная» ситуация с долларами и евро — и это не преувеличение
  4. Разворот по доллару: как быстро будет дорожать американская валюта? Прогноз курсов валют
  5. «Вясна»: По всей стране проходят обыски и допросы из-за связей с ЕГУ
  6. Замдиректора Купаловского театра, похоже, стал бывший сотрудник КГБ
  7. Минчанин пошел по просьбе матери поговорить с шумными соседями и был убит двумя братьями. СК раскрыл подробности
  8. На авторынок Беларуси возобновили поставки популярного бренда — раньше он был в топ-3 по проданным машинам
  9. Российский блогер-миллионник приезжал в офис Dana Holdings разбираться с долгом клиента. Поймал директора в неподходящий момент
  10. Личный «хутор» по соседству с резиденцией. Что известно о недвижимости политика, которого Лукашенко не хочет отпускать на родину
  11. После возвращения из Польши задержан бывший сотрудник КГБ — «Вясна»
  12. МТЗ ищет работников — какие кадры нужны и сколько готовы платить
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.