Немцы делают автоматический телефон-переводчик

Немцы делают автоматический телефон-переводчик

Германские учёные, взявшие в текущем году Германскую премию будущего, разрабатывают сотовый телефон с функцией перевода с одного языка на другой без подключения дополнительных устройств.

Чтобы разговор был переведён машинально, необходимо будет собрать определённый сервисный номер, совокупность соединит с нужным абонентом и сама переведёт диалог «в обе стороны».

8 лет назад несколько Вольфганга Вальстера (Wolfgang Walster) создала программу VerbMobil, на базе которой и разрабатывается телефон-переводчик. Программа, кроме германского, поддерживает ещё три языка — английский язык , японский и китайский.

По словам разработчиков, совокупность уже функционирует, но её возможности до тех пор пока ограничены — перевод происходит , пока разговор не выходит за рамки определённых, заблаговременно выбранных тем.

Напомним, что на базе VerbMobil в Германии уже создано более 20-ти изделий, удачно реализуемых на рынке. Среди них — совокупность речевого управления автомобилем, программа автоматизированной зачитывания и обработки вслух электронной почты, программа поиска музыки в сети по главным словам, программа, отвечающая по телефону на запросы о биржевых направлениях, и программа, дающая — кроме этого по телефону — справки о репертуаре кинотеатров.

На данный момент германские учёные занимаются развитием собственной совокупности распознавания речи. Они рассчитывают, что уже через пара лет для общения с компьютером ни мышь, ни клавиатура не будут необходимы.

«Нужно научить компьютер осознавать людскую обращение, причём не медлительно продиктованные фразы, а самую простую разговорную обращение», — вычисляет Вольфганг Вальстер. — «Более того, компьютер обязан осознавать ещё и мимику собеседника, и его жестикуляцию, и, по возможности, верно толковать все его перемещения. Чтобы создать максимально действенную совокупность распознавания речи, согласно точки зрения Вальстера, нужен более глубочайший анализ: сперва сказанная фраза акустически раскладывается на слова-догадки, каковые приобретают (либо не приобретают) подтверждение — в зависимости от того, какой текст звучал на протяжении того же диалога раньше».

Программа обязана знать практически столько же, сколько и человек. К примеру, реалии быта: в Германии принято обедать между полуднем и часом дня, а ужинать — по окончании 6-ти часов вечера.

В случае если германский предприниматель беседовать по телефону собственному американскому партнёру: «А позже давайте совместно сходим покушаем», то при переводе данной фразы программа обязана в зависимости от времени дней сообщить или «давайте совместно пообедаем», или «давайте совместно поужинаем».

Германские учёные не без гордости заявляют, что уже на данный момент VerbMobil безупречно распознаёт и переводит обращение. Программа «осознаёт» любого собеседника, даже если он говорит с выговором либо на одном из множества существующих в Германии диалектов.

VerbMobil разбивает звуковые сигналы на отдельные слова и старается их осмыслить, исходя из этого важной проблемой остаётся многозначность слов — к примеру, произнося германское слово «Bank», собеседник может иметь в виду и кредитный университет, и скамейку, и базу данных.

В будущем совокупность обязана мочь отфильтровывать оговорки и звуки-паразиты наподобие «эканья». Анализу подвергнется и мелодика фразы — так как интонацией возможно придать словам противоположный суть.

Но, по собственному признанию доктора наук Вальстера, его VerbMobil пока не в состоянии осознать и перевести, к примеру, философский спор либо беседу двух влюблённых. Но это вопрос времени.

Сравнительно не так давно в Германском исследовательском центре ИИ проводилась научная конференция на тему «Коммуникация между машиной и человеком», куда приехал основной программист Микрософт, причём за личный счёт — его не приглашали.

Из америки прибыли и многие другие известный эксперты-компьютерщики, и доктора наук таких респектабельных институтов как Стэнфордский университет и Массачусетский технологический университет, и все за собственный счёт.

«Это говорит о многом», — вычисляет Вальстер. — «Раньше лишь мы летали в том направлении, а сейчас и они прилетают к нам, дабы ознакомиться с отечественными разработками. Иными словами, мы занимаем в полной мере хорошее положение в мире и не уступаем признанным фаворитам — США и Японии».

Что же касается совокупностей распознавания русской речи, то германские учёные о них умалчивают. Однако, в последних числах Ноября создание таковой совокупности объявили компании Intel и Cognitive Technologies.

Сообщается, что уже создан широкий инструментарий для разработки, что включает большой речевой корпус русского RuSpeech, достаточный для распознавания естественной речи говорящего в настоящем времени.

Тексты для RuSpeech создавались 220 дикторами, любой из которых прочёл, в среднем, более 250 предложений. Так, в базу данных входит около 50 часов постоянной речи количеством 15 Гбайт на 30-ти c лишним компакт-дисках, а это более 50 тысяч предложений с фонетической разметкой каждой сказанной фразы.

Посредством RuSpeech компьютер сможет распознавать не только слова, но и отдельные их последовательности и фонемы, что разрешит минимизировать количество неточностей при распознавании новых, отсутствующих в базе, слов.

Эта разработка возможно использована в голосовых порталах, для голосового управления в телефонии (справочные работы, телефонный доступ к email, голосовой комплект номера), а также в совокупностях диктовки.

По оценкам департамента маркетинга Cognitive Technologies, количество рынка речевых разработок в Российской Федерации к 2006 году может составить порядка $200 миллионов.

Выходит, через каких-нибудь пять лет оргтехника будет осознавать нас с полуслова, а биржам труда и службам занятости нужно будет трудоустраивать безработных переводчиков.

Оффлайн переводчик для Андроид


Вы прочитали статью, но не прочитали журнал…

Читайте также: