Каталог
Электронные книги22229

Дипломная работа(ВКР) на С#. Анализ тональности текста.

Партнерам: 5 $как заработать
Оплатить с помощью:
с "Правилами покупки товаров" ознакомлен и согласен
Продаж: 1 (последняя 33 дн. назад)
Возвратов: 0

Загружен: 14.08.2015
Содержимое: ВКР.rar (9848,56 Кбайт)

Продавец

FixFever информация о продавце и его товарах
offlineЗадать вопрос

За положительный отзыв о купленном товаре продавец предоставит вам подарочную карту на сумму 316,2 руб..

Описание товара

Выпускная Квалификационная Работа на тему: "Разработка программных средств анализа тональности текстов на основе методов машинного обучения". Выполнено в 2015 году, защищено на "отлично" без каких либо замечаний. Сделана работа аккуратно и продумано. Программы реализованы в Visual Studio 2013 на языке C#. Оригинальность пояснительной записки(113 стр) по antiplagiat.ru - 84%. Объем и обширность работы (по словам заведующего кафедры) подходит как для защиты работы для бакалавриата, так и специалитета и даже магистратуры.

Фрагмент введения:
С развитием интернет-сервисов каждый пользователь получил в числе прочих возможность выражать свое мнение. Это может быть мнение относительно товара или услуги, фильма или книги, компании или политического деятеля. Таким образом возникла потребность обрабатывать огромные объемы информации для определения отношения пользователей к тому или иному объекту.
Очевидно, что количество отзывов публикуемых, например, в социальных сетях достигает десятков тысяч, и обработка отзывов вручную экспертами оказывается невозможной. В связи с этим широкое распространение получили такие области Computer Science, как Opinion Mining и Sentiment Analysis (от английского sentiment – чувство). Благодаря анализу тональности стало возможным автоматически получить или «извлечь» мнение, выраженное в тексте.
Анализ тональности текста (сентимент-анализ) – область компьютерной лингвистики, занимающаяся выделением из текстов эмоционально окрашенной лексики или эмоциональной оценки автора.
Анализ тональности текстов – сложная задача, т.к. требует глубокого знания явных и неявных, часто используемых и редких, синтаксических и семантических правил естественного языка. Исследователи в данной области сталкиваются с нерешенными проблемами из области обработки текстов на естественном языке такими как: разрешение различных неоднозначностей, обработка отрицания в текстах и др.
К задачам анализа тональности относятся:
•классификация документов на основе мнений;
•классификация предложений на основе мнений;
•анализ мнений на основе характеристик объекта;
•создание словаря мнений;
•поиск сравнений;
•поиск спама в отзывах;
•анализ полезности отзывов.
Проблема анализа мнений интернет-пользователей становится все более важной как с теоретической, так и с прикладной точек зрения. Сентимент-анализ привлекает крупные компании в связи со значительным распространением социальных медиа, ведь маркетологам всегда было необходимо мониторить СМИ в поисках упоминаний своих брендов.
Различные предметные области, типы и категории текстов требуют отдельного внимания. Не существует универсального алгоритма анализа тональности, который бы показывал достаточный уровень точности классификации в любой предметной области и категории текстов. В предлагаемой работе рассматривается не только задача анализировать тональность текстов, но и также проводится анализ и сравнение различных методов и подходов к классификации тональности текстов.
Актуальность данной темы состоит в том, что задача сентимент-анализа возникла сравнительно недавно и оптимального решения проблемы на данный момент не существует. Следует принять во внимание так же и то, что все задачи, так или иначе связанные с обработкой естественных языков – сложны и неоднозначны. Это в первую очередь касается методов машинного перевода, распознавания речи, а также сентимент-анализа. По этой причине, исследований в этой области не очень много, а русскоязычных работ практически нет.
Целью данной работы является реализация программного обеспечения, предназначенного для анализа тональности текстов на русском языке и анализа эффективности различных методов и подходов к анализу тональности текстов.

Дополнительная информация

В архиве(Пароль - Ryesd234@31#121):
1. Пояснительная записка (116 стр)
2. Аннотация
3. Отзыв от науч. рук.
4. Отчет антиплагиата
5. Презентация (20 слайдов)
6. Речь к презентации
7. Исходные коды программ (Проекты Visual Studio)
8. Данные для программ

Содержание пояснительной записки:
Введение8
1Исследовательский раздел11
1.1Цели и задачи анализа тональности текстов11
1.1.1Определение11
1.1.2Цели и применение анализа тональности11
1.1.3Проблематика в задаче определения тональности14
1.2Обзор видов классификации текстов15
1.2.1Классификация по бинарной шкале15
1.2.2Многоклассовая классификация15
1.2.3Регрессия16
1.2.4Субъективность/объективность17
1.3Обзор подходов к анализу тональности текстов17
1.3.1Подходы, основанные на наборах правил18
1.3.2Подходы, основанные на словарях тональностей19
1.3.3Машинное обучение20
1.3.3.1Машинное обучение с учителем21
1.3.3.2Машинное обучение без учителя21
1.4Обзор математических методов классификации в области машинного обучения с учителем22
1.4.1Метод ближайших соседей22
1.4.2Наивный Байесовский классификатор22
1.4.3Метод опорных векторов23
1.4.4Метод решающего дерева25
1.5Обзор методов организации вектора признаков25
1.5.1Получение корпуса текстов25
1.5.2Предварительная обработка текста28
1.5.3Вектор признаков29
1.5.3.1N-граммы29
1.5.3.2Символьные N-граммы30
1.5.4Взвешенный вектор31
1.5.4.1Бинарный вес31
1.5.4.2TF-IDF31
1.5.4.3dTF-IDF31
1.6Обзор программных решений в области анализа тональности текста на русском языке32
1.6.1«SentiStrength»32
1.6.2Модуль анализа тональности текста в системе «Аналитический курьер»33
1.6.3Модуль анализа тональности текстов в системе RCO Fact Extractor34
Выводы34
2Специальный раздел36
2.1Формальное описание предметной области36
2.1.1Задача классификации текстов и машинного обучения36
2.1.2Задача анализа тональности текста37
2.2Разработка архитектуры системы анализа тональности текста38
2.2.1Алгоритм анализа тональности текста38
2.2.2Алгоритм анализа эффективности различных методов классификации41
2.3Организация вектора признаков43
2.3.1Признаковое описание текста43
2.3.2Взвешенный вектор44
2.3.2.1Бинарный вес45
2.3.2.2dTF-IDF45
2.3.2.3Модифицированный dTF-IDF45
2.4Методы машинного обучения с учителем в области классификации47
2.4.1Наивный Байесовский классификатор (NB)47
2.4.2Метод опорных векторов (SVM)50
2.5Метод оценки точности классификатора51
2.5.1Метрика правильности и ошибочности52
2.5.2Точность и полнота52
2.5.3F1-мера53
Выводы54
3Технологический раздел55
3.1Выбор программных средств55
3.2Разработка архитектуры ПО57
3.3Разработка парсера данных из сети интернет58
3.3.1Выбор пользователем тональности рецензий59
3.3.2Выбор количества рецензий60
3.3.3Выбор начальной позиции60
3.3.4Парсинг и предобработка рецензий60
3.3.5Сохранение коллекции текстов61
3.4Реализация алгоритмов организации вектора признаков61
3.5Реализация алгоритмов обучения классификатора63
3.5.1Обучение Наивного Байесовского Классификатора63
3.5.2Обучение классификатора по методу опорных векторов64
3.5.2.1Обучение SVM-классификатора с бинарной функцией взвешивания65
3.5.2.2Обучение SVM-классификатора с функцией dTF-IDF6
3.5.2.3Обучение SVM-классификатора с функцией Mod dTF-IDF67
3.5.3Сохранение модели классификатора68
3.6Реализация алгоритмов классификации текстов68
3.6.1Алгоритм NB-классификации68
3.6.2Алгоритм SVM-классификации69
3.7Анализ точности классификации текстов70
Выводы75
4Другие разделы проекта77
4.1Руководство пользователя77
4.1.1Парсер рецензий ParserKinopoisk.exe77
4.1.2Основная программа Sentiment.exe78
4.2Руководство программиста82
4.3Руководство системного администратора83
5Заключение85
Список использованных источников87
Приложения 88

Пароль от архива - Ryesd234@31#121

Отзывы

0
Отзывов от покупателей не поступало.
За последние
1 мес 3 мес 12 мес
0 0 0
0 0 0
За положительный отзыв о купленном товаре продавец предоставит вам подарочную карту на сумму 316,2 руб..
В целях противодействия нарушению авторских прав и права собственности, а также исключения необоснованных обвинений в адрес администрации сайта о пособничестве такому нарушению, администрация торговой площадки Plati (http://www.plati.market) обращается к Вам с просьбой - в случае обнаружения нарушений на торговой площадке Plati, незамедлительно информировать нас по адресу support@plati.market о факте такого нарушения и предоставить нам достоверную информацию, подтверждающую Ваши авторские права или права собственности. В письме обязательно укажите ваши контактные реквизиты (Ф.И.О., телефон).

В целях исключения необоснованных и заведомо ложных сообщений о фактах нарушения указанных прав, администрация будет отказывать в предоставлении услуг на торговой площадке Plati, только после получения от Вас письменных заявлений о нарушении с приложением копий документов, подтверждающих ваши авторские права или права собственности, по адресу: 123007, г. Москва, Малый Калужский пер. д.4, стр.3, Адвокатский кабинет «АКАР №380».

В целях оперативного реагирования на нарушения Ваших прав и необходимости блокировки действий недобросовестных продавцов, Plati просит Вас направить заверенную телеграмму, которая будет являться основанием для блокировки действий продавца, указанная телеграмма должна содержать указание: вида нарушенных прав, подтверждения ваших прав и ваши контактные данные (организиционно-правовую форму лица, Ф.И.О.). Блокировка будет снята по истечение 15 дней, в случае непредставления Вами в Адвокатский кабинет письменных документов подтверждающих ваши авторские права или права собственности.