Lingvotutor.RU

Изучаем слова и не только…

Navigation Menu

Интервью с создателем Google Translate

Posted by on Авг 14, 2011 in Интервью |

Franz Josef Och — руководитель команды машинного перевода в компании Google и это именно тот человек, который стал “ударной силой” развития технологии Google Translate. Только не нужно сразу говорить, что мол переводчик от Google — это фигня фигней. Не забывайте, Google Translate используется на многих сайтах в качестве моментального перевода на ваш родной язык, и поверьте мне — это намного лучше, чем ничего. Разобраться с корявым русским переводом все же легче, чем с китайскими иероглифами, или вы поспорите с этим? Ну а теперь давайте почитаем интервью с данной личностью.

Как часто вы добавляете новые языки в словарь Google Translate?

Начиная с 2007 года процесс добавления новых языков стал привычным делом для моей команды. С запуском новых языков мы также обращаем внимание и на качество. Последние два с половиной года мы достигли рамки 52 разных языков и я думаю,  мы сделали довольно неплохой шаг вперед в улучшении технологии машинного перевода.

Последний язык, который мы добавили был Haitian Creole. Честно скажу, мне самому довольно необычно осознавать, что мы можем использовать технологии машинного перевода для таких маленьких языков. Если бы вы спросили меня три года назад, когда появятся Haitian Creole, или Yiddish, я бы наверняка ответил, что в далеком далеком будущем, либо вообще никогда. Но сейчас, благодаря интернету и возможности достать практическую любую информацию с помощью разных алгоритмов, мы можем создавать системы машинного перевода и для маленьких языков и заставляем их работать довольно хорошо.

Как это вообще возможно, сделать систему для языка Yiddish, ведь в нем нет особого текста, чтобы забить базу в инструмент перевода?

Во первых, Yiddish очень похож на немецкий язык и имеет сходство с некоторыми словами Hebrew и польского языков. Для этих языков у нас есть огромная база текстов. Что мы делаем, так это изучаем особенности языков, которые у нас есть, а потом составляем базу для Yiddish.

Как компания Google сумела предвидеть (на таких ранних этапах), что перевод веба будет очень востребованным?

Интервью с создателем Google TranslateЯзыковый барьер — действительно большая проблема для процесса коммуникации. Это особенно выражено в регионах, где практически нереально найти достаточное количество информации на своем родном языке, в то время, когда на другом — есть практически все. Такой язык как Арабский, где только 1% информации в интернете предоставляется на арабском, создает преграду для населения узнать больше. Наша идея довольно проста — с помощью технологий разрушить ограничения в интернете, но вот сможем ли мы это сделать? Каждый имеет право пользоваться информацией в интернете.

Когда я стал работать в Google, Я позвонил Larry и высказал свою идею по поводу перевода сети. Я аргументировал свои домыслы тем, что кому как не поисковой системе это нужно больше всего. Чем больше людей сможет понимать язык информации, тем больше будет пользователей и самой поисковой системы. Он сказал, что это одна из самых главных миссий компании.

Идеальным будет следующая модель: если человека интересует какой-то вопрос и он вводит его на своем родном языке, результат выдачи должен быть многогранным. То есть, если не было найдено подходящего ответа например в русском Google, то мы должны направить на решение задачи в переводе с английского языка. Надеюсь, я не запутал вас.

Как близко вы приближаетесь к достижению такой цели?

Ну это сложный вопрос. В некоторой степени, мы уже сделали некий прогресс, ведь сейчас подходящее время для исследования науки машинного перевода. Судя по статистике, все больше и больше людей используют машинный перевод в интернете и это помогает им открывать совершенно новые просторы. Но с другой стороны, мы знаем, что у нас еще есть много проблем и задач в будущем. На данный момент мы работаем над качеством перевода машинных программ.

Таким образом, моя работа довольно таки долгосрочная. На протяжении многих лет будет что изменять и над чем работать. Хочется отметить, что для некоторых языков (испанский и португальский) качество машинного перевода достигло солидного уровня. Но вот с маленькими языками еще нужно работать и работать. Это будет “бесконечный” процесс улучшения.

Когда вы тестируете переводчик, вам нужно иметь так званные параллельные тексты, где есть как минимум два языка. Где вы достаете все эти формы?

Когда мы только начинали создавать нужную базу, мы брали стандартные формы, которые любезно предоставлял Linguistic Data Consortium — институт лингвистических исследований. Потом мы поняли, что есть такая потрясающая организация как Лига Наций, где каждый документ переведен на 6 языков. Перевод документов на таком уровне осуществляется  очень профессиональном людьми, поэтому мы почерпнули много полезного из предоставляемых переводов.

Но с другой стороны, это и эффект “веба”. Все документы, которые есть в интернете в той или иной степени, являются переводом друг друга.  Безусловно, качество перевода в некоторых случаях оставляет желать лучшего, но это и есть интересная задача для нас. Мы стараемся устранить самые дефектные переводы и оставить только самые адекватные.

Наши алгоритмы, практически все мои — это именно то, что делает перевод лучше.

Это некий тип аналогий, который используется пауком Google для считывания веб страниц?

Очень похоже на то. У нас есть два типа поисковых пауков: один отвечает за индексацию страниц в интернете, другой за наличие текстов, которые включают перевод. Задача второго — это попытаться найти тексты, которые были переведены на другой язык и найти соответственный адекватный перевод слов.

Вы используете информацию из книг Google как источник хорошего перевода?

Безусловно, книги являются хорошим источником полезной информации для машинного перевода. Классические произведения были переведены на несколько языков мира и перевод этот уж очень высокого качества. Но в каждом языке есть своя специфика, поэтому использовать все — будет просто  неправильно. Мы подстраиваемся под каждый язык индивидуально. Отвечая на ваш вопрос — да, мы используем книги.

Версия для Андроида программы Google Translate позволяет пользователю проговорить слово, а потом автоматически переводит его. Как работает эта система?

Способ, которым мы распознаем речь, очень похож на принцип работы простого электронного переводчика. В основе обеих методов лежит ну просто громадный объем информации. Для машинного перевода нам нужно иметь перевод, для распознавания речи — специальные сигналы, которые есть в базе и сформированы по принципу транскрипции. Чем больше у нас есть транскрипции слов, тем лучше будет качество распознавания.

Это практически шаг в перед, в мир перевода в реальном времени, а-ля универсальный переводчик «Star Trek’s»?

У нас есть все необходимое оборудование и ресурсы, чтобы повысить уровень распознавания речи и машинного перевода  до новых, невиданных ранее, рубежей. Все это дело времени, друзья, дело времени…

*Перевод статьи с Los Angeles Times, специально для lingvotutor.Ru

Далее

Для чего нужен апостиль документов?

Posted by on Авг 14, 2011 in Статьи о языках |

Все, кто сталкивался с переводом официальной документации, обязательно слышали об апостиле. Что же означает это загадочное слово? Апостиль — это штамп, специально проставляемый на некоторых официальных документах с некоммерческим содержанием, которые были выданы в различных учреждениях 93-х стран, подписавших Гаагскую конвенцию об отмене требований легализации иностранных официальных документов от 5 октября 1961 года. Этот знак свидетельствует о подлинности подписи и должности чиновника, а иногда и заверяет штамп или печать, которой скрепили документ. Его в дальнейшем не нужно заверять, поэтому заверенная им справка, доверенность или диплом будут признаны органами всех стран, подписавших Гаагскую конвенцию.

Апостиль ставится либо на обратной стороне документа, либо в его месте, свободном от текста, иногда также на свободном листке, который пришивается с обязательным заверением количества листов к основной бумаге. В большинстве случаев штамп проставляется на оригиналах, лишь в некоторых случаях его можно ставить на копии, и то при условии, что они — нотариально заверены.

На каких же документах необходимо ставить подтверждающий штамп? В статье 1 Гаагской конвенции сказано, что он необходим в случае, если официальный документ, который выдан на территории одного государства, должен быть предоставлен на территории другого государства. Сюда относятся документы об образовании, свидетельства, справки, доверенности, документы о гражданском состоянии, судебные решения, материалы по уголовным, гражданским, административным делам, патентные и регистрационные справки и свидетельства, доверенности.

Существует также ряд стран, которые требуют проставление двойного апостиля. Например, если вы собрались поступать в университет Великобритании, то вам необходимо подтвердить подписи и печати на документе об образовании. Сначала ставится заверяющий штамп на оригинал, после вам необходимо перевести с русского на английский ваш аттестат или диплом, заверить перевод у нотариуса и подать его на проставление второго штампа. Такую процедуру требуют Австрия, Великобритания, Бельгия, Франция, Швейцария, Нидерланды, Португалия, а также Италия.

Для того, чтобы поставить апостиль документов, необходимо обратиться, в зависимости от типа документов, в Министерство юстиции, Министерство обороны, Министерство Внутренних дел РФ, Рособнадзор, Росархив или органы ЗАГС. Обычно на эту процедуру требуется от одного до нескольких дней. Кроме того, нужно оплатить госпошлину в размере 1500 рублей за документ.

Далее

Языковые курсы — как выбрать правильные

Posted by on Авг 14, 2011 in Статьи о языках |

Потребность в качественном знании иностранного языка растет постоянно. И многие оказываются перед необходимостью выбирать языковые курсы для изучения или совершенствования своих знаний. Но не стоит идти на первые попавшиеся. Потому что от того, насколько доходчиво будут преподавать язык, будет зависеть эффективность обучения. Итак, на что же стоит обратить внимание, чтобы выбрать хорошие языковые курсы.

Естественно, для каждого из нас не последнюю роль играют такие факторы как стоимость обучения и график занятий. Но не только это должно волновать. Не секрет, что после посещения некоторых курсов знания в голове почему-то не укладываются. Другие же, напротив, преподносят материал доступно и интересно. Поэтому прежде чем пойти на курсы – почитайте отзывы в интернете. Бывшие учащиеся, наверняка, расскажут правду о стиле преподавания, манере подачи материала. В таком случае можно будет сразу же выбрать для себя оптимальные варианты.

Но не стоит останавливаться на одних лишь отзывах. Желательно пообщаться и с преподавателями курсов. В личной беседе можно составить впечатление о человеке, его профессионализме, понять, что он собой представляет как преподаватель иностранного языка.

Весьма полезным будет и пробный урок – сегодня такую услугу предоставляют на многих курсах. В таком случае у учащегося есть возможность попробовать на себе уже в процессе обучения – подходят ли ему такие курсы или нет. Причем сегодня пробные уроки на многих языковых курсах предлагают бесплатно.

Далее

Интересное об английском языке

Posted by on Авг 11, 2011 in Статьи о языках |

Все языки народов мира имеют массу интересных и познавательных фактов. Именно, с них и начинают прогрессивные преподаватели современности обучение иностранным языкам. Это способствует увеличению интереса к изучаемому языку, в особенности, если речь идет о преподавании в детском коллективе. Сейчас стоит акцентировать внимание на английском языке. Тем более, по статистическим данным, он является самым популярным и востребованным языком в мире. Итак, немного любопытных фактов, добавляющих интерес к изучению английского языка:

1) На сегодняшний день, основным языком английский является свыше, чем для 500 миллионов человек на Земле;

2) В качестве иностранного языка, английский изучают свыше, чем полтора миллиарда человек в мире;

3) Возраст самых древних слов английского языка, которые дошли до наших дней без изменений насчитывает свыше четырнадцати тысяч лет; И одно из них обозначает не какие-то экзотические фрукты, а обычное яблоко.

4) По количеству синонимов английский язык находится на первом месте, среди всех языков мира;

5) Общее количество слов в английском языке доходит до восемьсот пятидесяти;

6) Количество букв в самом длинном слове английского языка насчитывает сорок пять;

7)  Наиболее часто используемая буква в словах английского языка – «E»;

8)  Наименее часто используемая буква в словах английского языка – «Q»;

9)  На всей территории Иллинойса введен штраф за использование в разговоре английского языка;

10)  Первый человек, оказавшийся на спутнике Земли Луне, самым первым произнес английское слово Ok;

11)  Слово алфавит, написанное на английском представляет собой видоизмененное написание букв альфа и бета, позаимствованных у греков;

12) В слово «four» количество букв соответствует числительному значению слова. Это единственное, в своем роде, слово английского языка.

И это только небольшой список интересных сведений об английском языке.

English

Далее

Билингвизм, чтобы выжить

Posted by on Авг 11, 2011 in Статьи о языках |

Туристов, прилетающих в Сингапур, в числе других компонентов «сингапурского чуда» поражает поголовное владение местным населением английским языком. Прошло больше полувека, как город-государство получил независимость от Великобритании – англичане ушли, ликвидировав свою военную базу и оставив свою бывшую колонию без средств к существованию.

Большинство населения в то время имело китайские корни. Обычно национальные элиты поддаются соблазну отбросить всё, что принесли на их землю «чужаки». Забыть, как страшный сон английский язык, вернуться к истокам, кисти — чёрная тушь – иероглифы? Но стране повезло – премьер-министр Сингапура Ли Куан Ю не собирался упускать преимуществ билингвизма. В Сингапуре, начиная с начальной школы, изучается английский язык наряду с родным. Это было сделано ещё в 70-е годы прошлого века, когда страна искала свой путь, свою нишу в мировом разделении труда.

Сингапур не обладает никакими природными ресурсами – даже речной песок и пресная вода экспортируются из соседней Малайзии. Это было время, когда нужны были инвесторы, чтобы дать работу и средства к существованию населению Сингапура. Инвесторы должны были строить свои заводы именно у них, а не в соседних странах. Одним из аргументов для межнациональных корпораций стало поголовное владение английским языком всеми сингапурцами.

Их легко было обучить достаточно сложным манипуляциям, и в Сингапур потянулись высокотехнологичные производства. В конечном итоге это привело страну к процветанию.

Билингвизм

Далее