Поддержать нас
Беларусы на войне
  1. Ожидаемый взлет курса доллара откладывается — вот причины. Прогноз курсов валют
  2. Власти признали экстремистским фильм «Дорога на Куропаты» студии «Беларусьфильм», который был награжден Государственной премией
  3. Лукашенко «с нетерпением» ждет предстоящей встречи с мировым лидером, к которому неоднократно летал
  4. Для населения хотят ввести новшества в отношении электричества — что и для кого могут изменить
  5. «Белтелеком» ввел изменения для клиентов. Одно из новшеств касается Zala
  6. Насильник похитил школьницу и 18 лет держал ее в плену под носом у полиции. Эта история может изменить ваш взгляд на мир — рассказываем
  7. Еще один беларусский сервис вслед за банками будет требовать включить геолокацию
  8. Беларус прилетел в Армению из Польши по работе. Его задержали в аэропорту, но позже отпустили
  9. Офис Тихановской рассказал об итогах проверки в отношении Алины Харисовой после скандала с ее «вербовкой» спецслужбами
  10. США и Иран заявили о достижении мирного соглашения. Подписать его планируется в пятницу в Женеве
  11. От ливней и града до жары. Какой погоды ждать на следующей неделе
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.