Научно-практический семинар «Типы поисковых запросов в лингвистических корпусах»
13 мая в 17.00 в рамках серии научно-практических семинаров «Возможности и перспективы анализа текстов и машинного обучения» прошла завершающая встреча этого учебного года, на которой в качестве приглашенного лектора выступил Захаров Виктор Павлович, к.ф.н., доцент кафедры математической лингвистики Санкт-Петербургского государственного университета. Виктор Павлович - автор многочисленных работ по корпусной лингвистике, включая учебник "Корпусная лингвистика", который входит в любой библиографический список публикаций по темам, связанным с корпусными технологиями в лингвистике.
Темой онлайн-встречи, на которую пришли студенты, магистранты и преподаватели ПетрГУ, стали типы поисковых запросов в лингвистических корпусах. После краткого введения о том, что такое лингвистический корпус, В.П. Захаров сначала рассказал, а затем и наглядно в онлайн-режиме показал несколько различных лингвистических корпусов и их возможности в плане поисковых запросов.
Кроме наиболее известных крупных корпусов НКРЯ, SketchEngine, COCA, Aranea, были показаны и менее известные корпуса InterCorp, Google Books Ngram Viewer, Corpora Collection Leipzig, ХАНКО и на их примере представлены различные системы поиска – (No)SketchEngine, Treq, Word at a Glance, SyD и другие.
Как отметила соорганизатор мероприятия И.А. Котюрова:
Возможности работы с многомиллиардными объемами текстов в многоязычных корпусах очень впечатляют. Для лингвистов в последние годы отрылась целая новая Вселенная под названием корпусная лингвистика. А знания, которыми поделился с нами на научно-практическом семинаре В.П. Захаров, схожи космическому кораблю, на котором можно взглянуть на эту Вселенную. И насколько подробно мы хотим ее изучить, теперь зависит только от желания лингвиста. Инструмент у нас в руках.

