Възможността за преодоляване на езиковите бариери е от основно значение в глобалния свят, в който живеем. С новата технология на Meta, SeamlessM4T, вече сме с една стъпка по-близо до реализирането на идеята за универсален преводач. Както обяви Meta AI:
Този модел е първият всичко-в-едно, многоезичен модел за превод на различни модалности. Той съчетава в себе си функции за превод на реч в текст, текст в реч и текст в текст, както и за автоматично разпознаване на реч за до 100 езика в зависимост от задачата.
Основни характеристики и възможности на SeamlessM4T
SeamlessM4T е първият, който изпълнява цялата задача за превод в едно действие, без да го разделя на различни системи. Той е конструиран да обслужва широка гама от задачи, обхващащи от превод на реч в текст до автоматично разпознаване на реч.
SeamlessM4T представлява значителен напредък, тъй като този нов модел извършва цялата задача по превод наведнъж, за разлика от други големи модели за превод, които разделят превода на различни системи
– коментират от Meta AI.
Един от наистина уникалните аспекти на SeamlessM4T е способността му да разпознава така нареченото „кодово превключване“ – момента, в който говорещият преминава от един език на друг в рамките на едно и също изречение.
За да илюстрира този капацитет, Meta публикува видео, в което моделът бързо различава между хинди, телугу и английски. Това е функция, която мнозина от нас, които често сменяме езици в ежедневието си, ще оценим. От личен опит мога да кажа, че повечето софтуери за разпознаване на реч с труд се справят с тази задача.
Във демо видеото, ученият от Meta AI, Пако Гузман, споделя:
Целта ни е да създадем по-свързан свят. С SeamlessM4T, този свят може да стане реалност много по-скоро, отколкото сме си представяли.
Етичният подход на Meta: Справяне с токсичността и предвзетостта в преводите
Освен технологичната прецизност, при разработването на SeamlessM4T, Meta е обърнала внимание на деликатния въпрос за токсичността в данните. Както представители на компанията споделят:
Филтрирахме обучителните данни, за да отстраним небалансирана токсичност. Ако входните или изходните данни отразяваха различия в нивата на токсичност, премахвахме тази обучителна последователност поради токсичността.
В допълнение, SeamlessM4T може да квантифицира половата предвзетост в преводите, което го прави не само технологично напреднал, но и социално отговорен инструмент.
Как да използваме SeamlessM4T и къде да намерим отворения код?
Ако сте заинтересовани да опитате SeamlessM4T, най-добрият начин да го направите е да посетите демо версията на модела на https://seamless.metademolab.com. Там можете да изпробвате превод на различни езици, включително и български, в реално време. Ето как става:
- Изберете тиха среда и записвайте цяло изречение на езика по ваш избор.
- Изберете до три езика, на които искате да преведете изречението.
- Вижте транскрипцията и слушайте преводите.
За тези от вас, които са повече технически ориентирани или искат да вникнат в детайлите, отвореният код на SeamlessM4T е достъпен за изтегляне на GitHub.
В заключение, създаването на универсален езиков преводач е задача, която се изправя пред множество трудности, както подчертават от Meta. Въпреки това, новият модел SeamlessM4T представлява значителен напредък в тази насока. Той не само разширява границите на възможното в областта на машинния превод и автоматичното разпознаване на реч, но също така отговаря на важни социални и етични въпроси, като токсичност и полова предвзетост в езика.
Целта на AIBulgaria.com е да предоставя актуална и стойностна информация от света на изкуствения интелект (AI). Последвайте ни в социалните мрежи – Facebook, Instagram, Twitter и LinkedIn. Също така, може да се присъедините към нашия Discord сървър!