[
новости
/
+++
|
форум
|
теги
|
]
TextCat - implementation of the text categorization algorithm
15 Sep 2004
[
исправить
]
TextCat - implementation of the text categorization algorithm
Реализация алгоритма "N-Gram-Based Text Categorization" (на Perl) статистического анализа текста для автоматического определения языка на котором написан текст (для русского языка производится также определение кодировки).
Статья отражающая суть алгоритма
(на русском языке).
http://odur.let.rug.nl/~vannoord/TextCat/
Полезные Perl модули.
Преобразование из одной кодировки в другую
rus
,
codepage
,
language
, (
найти похожие документы
)
Добавить ссылку
Поиск ссылки (
regex
):
Последние заметки
-
03.11.2025
Отсеивание AI-ботов на web-сервере через Cookie
-
01.11.2025
Запуск Linux-контейнеров во FreeBSD
-
26.10.2025
Создание загрузочного атомарно обновляемого образа Oracle Linux при помощи OSTree
-
19.09.2025
Сборка deb-пакета для решения проблем с плагином nvim-cmp для neovim в Debian 13
-
09.09.2025
Запуск KDE Plasma 6 с Wayland во FreeBSD
-
05.09.2025
Отладка исходного кода Asterisk
-
29.06.2025
Повышение производительности FUSE при помощи io_uring
-
04.04.2025
Объединение корневого и home разделов в RHEL/CentOS/Alma/Rocky 9 при использовании XFS
-
11.03.2025
Политики для включения Manifest V2 и форсирования DNS через HTTPS в Chrome для Linux
-
19.01.2025
Установка движка графических квестов RenPy в Debian
RSS
|
Следующие 15 записей >>
Партнёры:
Хостинг:
Закладки на сайте
Проследить за страницей
Created 1996-2025 by
Maxim Chirkov
Добавить
,
Поддержать
,
Вебмастеру