В прошлый раз мною была не совсем полностью сформулирована проблема (задача). Упущена была одна из ключевых задач: мы решаем проблему поиска фактов и персоналий для любого языка. То есть алгоритм должен показывать одинаково хорошие результаты как на Английском, Украинском так и Русском или любом другом.
Напомню что мы условились вычленять персоналии по большой букве. Так же условимся что у нас есть множество А, в котором перечислены все символы после которых ставится большая буква (это сделано для того, что бы мы не спутали персоналию с обычным словом). А значит что если слово начинается с большой буквы и последний не пустой символ перед ним не содержится в множестве А — это слово будет считаться персоналией, а предложение в котором содержится это слово — фактом о данной персоне.
Разумеется теперь мы можем в автоматическом режиме решить следующее задачи:
- составить список персон которые упоминаются в тексте< ... Читать дальше »
Категория: MadWin | Просмотров: 869 | Добавил: analiz | Дата: 2009-06-02 | Комментарии (0)