Применение различных практических методик для систематизации и извлечения полезной текстовой информации из неструктурированных данных с использованием языка программирования JavaОбработка естественного языка (Natural Language Procession - NLP) представляет собой важную область разработки прикладного ПО и, с учётом современных задач ИТ, в будущем эта важность будет только возрастать. Уже сейчас наблюдается рост потребности в приложениях, работающих с естественными языками на основе NLP-методик.В книге "Использование Java для обработки естественного языка" рассматриваются способы организации автоматической обработки текста с применением таких методик, как полнотекстовый поиск, правильное распознавание имён, кластеризация, извлечение информации и составление аннотаций. Концепции обработки естественного языка излагаются таким образом, что даже читатели, не обладающие знаниями об этой технологии и о методах статистического анализа, смогут понять их.Если вы программируете на языке Java и хотите узнать о решениях элементарных задач, составляющих основу обработки естественного языка, то эта книга для вас. Вы научитесь выбирать и практически применять базовые методики обработки естественного языка для выполнения многих элементарных задач, а также включать их в реальные приложения, решающих более сложные, комплексные задачи. Читатель должен обладать некоторым опытом разработки программ на языке Java.Эта книга поможет:глубоко понять сущность основных задач обработки естественного языка и их взаимосвязи друг с другом;изучить и практически использовать доступные механизмы токенизации;реализовать методики определения границ предложений;освоить применение специальных методик поиска имён людей и прочих именованных объектов в документе;реализовать решения для определения морфологической разметки приложений;научиться использовать синтаксические анализаторы для определения взаимосвязей между элементами документа;объединить элементарные задачи в эффективную цепочку, способную решать более сложные и объёмные задачи обработки естественного языка.
Primenenie razlichnykh prakticheskikh metodik dlya sistematizatsii i izvlecheniya poleznoy tekstovoy informatsii iz nestrukturirovannykh dannykh s ispolzovaniem yazyka programmirovaniya JavaObrabotka estestvennogo yazyka (Natural Language Procession - NLP) predstavlyaet soboy vazhnuyu oblast razrabotki prikladnogo PO i, s uchyetom sovremennykh zadach IT, v budushchem eta vazhnost budet tolko vozrastat. Uzhe seychas nablyudaetsya rost potrebnosti v prilozheniyakh, rabotayushchikh s estestvennymi yazykami na osnove NLP-metodik.V knige "Ispolzovanie Java dlya obrabotki estestvennogo yazyka" rassmatrivayutsya sposoby organizatsii avtomaticheskoy obrabotki teksta s primeneniem takikh metodik, kak polnotekstovyy poisk, pravilnoe raspoznavanie imyen, klasterizatsiya, izvlechenie informatsii i sostavlenie annotatsiy. Kontseptsii obrabotki estestvennogo yazyka izlagayutsya takim obrazom, chto dazhe chitateli, ne obladayushchie znaniyami ob etoy tekhnologii i o metodakh statisticheskogo analiza, smogut ponyat ikh.Esli vy programmiruete na yazyke Java i khotite uznat o resheniyakh elementarnykh zadach, sostavlyayushchikh osnovu obrabotki estestvennogo yazyka, to eta kniga dlya vas. Vy nauchites vybirat i prakticheski primenyat bazovye metodiki obrabotki estestvennogo yazyka dlya vypolneniya mnogikh elementarnykh zadach, a takzhe vklyuchat ikh v realnye prilozheniya, reshayushchikh bolee slozhnye, kompleksnye zadachi. CHitatel dolzhen obladat nekotorym opytom razrabotki programm na yazyke Java.Eta kniga pomozhet:gluboko ponyat sushchnost osnovnykh zadach obrabotki estestvennogo yazyka i ikh vzaimosvyazi drug s drugom;izuchit i prakticheski ispolzovat dostupnye mekhanizmy tokenizatsii;realizovat metodiki opredeleniya granits predlozheniy;osvoit primenenie spetsialnykh metodik poiska imyen lyudey i prochikh imenovannykh obektov v dokumente;realizovat resheniya dlya opredeleniya morfologicheskoy razmetki prilozheniy;nauchitsya ispolzovat sintaksicheskie analizatory dlya opredeleniya vzaimosvyazey mezhdu elementami dokumenta;obedinit elementarnye zadachi v effektivnuyu tsepochku, sposobnuyu reshat bolee slozhnye i obyemnye zadachi obrabotki estestvennogo yazyka.