Skip to content
This repository was archived by the owner on Nov 20, 2024. It is now read-only.

AndreyTulyakov/TextStageProcessor

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

182 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Text Stage Processor

Open source project for text mining process exploration.

Требования:

  1. Операционная система: Windows, Linux, MacOS.
  2. Язык программирования: Python 3
  3. Входные файлы: каталог или отдельные текстовые файлы с расширением .txt в кодировке UTF-8 содержащие текст на русском языке.
  4. Выходные файлы: формат TXT и CSV (помещаются в специальный каталог для выходных файлов)
  5. Библиотеки: фреймворк Anakonda 3, pymorphy2
  6. Алгоритмы ТextМining должны быть реализованы кодом.
  7. Программная реализация алгоритмов тестируется

Установка на Window

Наиболее простой вариант:

  • Если в системе имеется Python3, то удалить его. (Если вы не собираетесь его использовать далее)
  • Установить пакет Anakonda 3. (https://www.continuum.io/downloads)
  • Установить библиотеку pymorphy2 с помощью команды: python -m pip install pymorphy2

В случае использования чистого языка Python 3 необходимо установить библиотеки:

  • matplotlib
  • pymorphy2
  • numpy
  • pyqt5
  • lapack
  • scipy
  • sclearn
  • pandas

По вопросам

Andrew Tulyakov (mhyhre@gmail.com)

Разработано с участием:

Дмитрий Кузнецов (megalord2@mail.ru) Николай Сябро (6xitix6@gmail.com)

About

No description or website provided.

Topics

Resources

Stars

Watchers

Forks

Contributors

Languages