Поддержать нас
Беларусы на войне
  1. Беларусский «мясной барон» продвигает на эстраду дочку. Рассказываем, что не так с этой идеей
  2. КГБ добавил четырех беларусов в список «террористов»
  3. Налоговики предупредили население, что заработало очередное новшество
  4. Выпускные в Минске пройдут в новом формате: их впервые массово вынесут за пределы школ
  5. Руководителя отдела продаж в частной компании Минска судили за комментарий о Лукашенко
  6. У олимпийской чемпионки Дарьи Домрачевой есть неожиданный бизнес в Беларуси. Вот что узнало «Зеркало»
  7. Минск в 2024 году развязал налоговую «войну» с «недружественными» странами. Пришел ответ от одного из государств ЕС
  8. Вскоре подорожают некоторые жилищно-коммунальные услуги. Какие и на сколько
  9. «Мыслепреступление. Но как же больно». Золотова рассказала о новых задержаниях родственников политзаключенных
  10. «Не верила, что за такое можно сесть». Беларуска отказала парню — и в итоге попала в тюрьму
  11. Еще один производитель обуви оказался в «реанимации» — раньше его собирался спасать «Белвест»
  12. Один из трех китов. История старейшего и самого знаменитого беларуса в мире, который помог человечеству проложить путь в космос
  13. «Ситуацию уже не спасают ни дешевеющая ипотека, ни подъезжающие россияне». Что происходит на рынке недвижимости в Минске
  14. «Удел сильных — прощать». Первое интервью Марфы Рабковой после пяти с половиной лет за решеткой
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.