Очень классный выпуск! Учёные и их наука🔬 Совместный спецпроект, полезные ресурсы и курсы про лингвистику и NLP
На днях мы запустили проект вместе с каналом «Русские норм!» — серию выпусков про современных учёных. Тема первого видео лежит на стыке лингвистики и компьютерных наук. В нём участвуют:
— Руководитель Лаборатории естественного языка Яндекса и ВШЭ в Санкт-Петербурге Иван Ямщиков
— Учёный Яндекса Андрей Малинин
— Директор центра языка и мозга ВШЭ Ольга Драгой
— Доцент Школы лингвистики ВШЭ Борис Орехов
К старту проекта мы подготовили большую подборку источников знаний по обработке естественного языка. Лучше всего сначала посмотреть первый выпуск, а затем, вдохновившись, погулять по ссылкам и посмотреть, какие из курсов и статей могут быть вам интересны.
🔸 С чего начать погружение в тему?
— Обзорная статья Академии «Как устроены языковые модели и как они развиваются» (рассказываем на примере Балаболы): https://clck.ru/WsN3G
— Большой материал Ивана Ямщикова про вызовы в NLP: https://clck.ru/YT2ib
— Интервью Лены Войты, исследовательницы Yandex Research и преподавательницы ШАД: https://clck.ru/V3TtD
🔸 Курсы для тех, кто уже изучил основы ML и хочет сфокусироваться на NLP
— Интерактивный учебник Лены Войты «NLP Course For You»
https://clck.ru/YT2wA
В учебнике объясняются все базовые термины и есть ссылки на сторонние материалы, которые могут помочь лучше разобраться. Во всех главах есть теоретическая часть и практические упражнения: в части из них нужно поразмышлять над абстрактными вещами, в других — попробовать применить модели обработки языка.
— Обработка текстов, написанных на естественных языках
ya.cc/ihoecXO1tFQcV
Сотрудники Яндекса и факультета компьютерных наук ВШЭ рассматривают широкий круг задач по обработке естественного языка: анализ тональности, отслеживание состояния диалога и многие другие. В рамках обучения можно даже создать собственного чат-бота.
— Нейронные сети и обработка текста
stepik.org/course/54098/promo
Курс не для новичков: от слушателей нужны базовые знания в машинном обучении. Он учит применять нейросети для обработки текстов на естественном языке: готовить данные, извлекать смыслы, генерировать тексты и разбирать их структуру.
— Стэнфордский курс CS224N
http://cs224n.stanford.edu
Стэнфордский курс CS224N через множество лекций и сложных практических заданий обучает обработке естественного языка (Natural Language Processing, NLP). Например, лекторы разбирают архитектуры рекуррентных нейронных сетей, которые служат одной из ключевых технологий в NLP.
🔸 Куда пойти, если хочется заниматься исследованиями в области NLP
— Лаборатория естественного языка Яндекса и НИУ ВШЭ в Санкт-Петербурге: https://clck.ru/YT3EG
— Лаборатория фундаментальных исследований Яндекса и МФТИ: https://clck.ru/YT3Hf
— ABBYY Lab в МФТИ (для тех, кому интересны исследования на стыке NLP и СV): https://clck.ru/YT3PB
— Научная-учебная лаборатория Яндекса на Факультете компьютерных наук ВШЭ: https://clck.ru/YT3Rh