В
прошлый раз мною была не совсем полностью сформулирована проблема
(задача). Упущена была одна из ключевых задач: мы решаем проблему
поиска фактов и персоналий для любого языка. То есть алгоритм должен
показывать одинаково хорошие результаты как на Английском, Украинском
так и Русском или любом другом.
Напомню что мы условились вычленять персоналии по большой букве. Так же условимся что у нас есть множество А, в котором перечислены все символы после которых ставится большая буква (это сделано для того, что бы мы не спутали персоналию с обычным словом). А значит что если слово начинается с большой буквы и последний не пустой символ перед ним не содержится в множестве А — это слово будет считаться персоналией, а предложение в котором содержится это слово — фактом о данной персоне.
Разумеется теперь мы можем в автоматическом режиме решить следующее задачи:
- составить список персон которые упоминаются в тексте< ... Читать дальше »
Напомню что мы условились вычленять персоналии по большой букве. Так же условимся что у нас есть множество А, в котором перечислены все символы после которых ставится большая буква (это сделано для того, что бы мы не спутали персоналию с обычным словом). А значит что если слово начинается с большой буквы и последний не пустой символ перед ним не содержится в множестве А — это слово будет считаться персоналией, а предложение в котором содержится это слово — фактом о данной персоне.
Разумеется теперь мы можем в автоматическом режиме решить следующее задачи:
- составить список персон которые упоминаются в тексте< ... Читать дальше »