Пакет hunalign: Информация
Исходный пакет: hunalign
Версия: 1.1-alt1
Собран: 16 апреля 2012 г. 18:57
Категория: Работа с текстом
Сообщить об ошибке в пакетеДомашняя страница: http://mokk.bme.hu/resources/hunalign/
Лицензия: LGPL
О пакете: Выравниватель предложений hunalign
Описание:
hunalign выравнивает двуязычный текст на уровне предложения. Его входные данные представляют собой маркированный и разделённый на предложения текст на двух языках. В простом случае его вывод представляет собой последовательность двуязычных пар предложений (двуязычных предложений). При наличии словаря hunalign использует его, комбинируя эту информацию с информацией о длине предложения по алгоритму Gale-Church. При отсутствии словаря он сначала возвращается к информации о длине предложения, а затем автоматически создаёт словарь на основе этого выравнивания. Затем он перестраивает текст за второй проход, используя автоматически сгенерированный словарь. Как и большинство выравнивателей предложений, hunalign не меняет порядок предложений: он не может использовать перекрёстные выравнивания, то есть когда сегменты A и B на одном языке соответствуют сегментам B' A' на другом языке. hunalign не имеет отношения к венгерскому языку, его название отражает тот факт, что он является частью набора инструментов hun* NLP.
Список rpm-пакетов, предоставляемых данным srpm-пакетом:
hunalign (x86_64, i586)
hunalign-data (noarch)
hunalign-debuginfo (x86_64, i586)
hunalign (x86_64, i586)
hunalign-data (noarch)
hunalign-debuginfo (x86_64, i586)
Сопровождающий: Vitaly Lipatov