Вижте класирането
на този сайт в:
BGTop.net
Българския ТОП

Транспорт за София и страната - 12 тона, 17 европалети, хладилен фургон, брезент 0898529582

Бърз хостинг от 2.90 лева!

Българска граматика grammar-bg

12:50:25 18 юли 2016

Публикувани са изпълними файлове за Windows на адрес: http://vanyog.github.io/grammar-bg/.

grammar-bg readme.html fail

Описание

grammar-bg представлява опит за компютърно междуплатформено представяне на българския език. Надявам се проектът grammar-bg да бъде полезен при: създаване на различни речници (правописни, синонимни, тълковни, двуезични) и програми за: проверка на правописа и граматиката, показване на справочна информация, автоматична обработка на български текстове, превод от български на друг език или обратно и т.н.

grammar-bg е проект с отворен код (GNU GPL 3) и представлява набор от C++ заглавни файлове и файлове с код, ползващи библиотеката Qt. В тези файлове се дефинират набор от класове, описващи речниковия състав (и в бъдеще) граматиката на българския език. На базата на тези файлове е съставена компютърна програма grammar-bg, която демонстрира някои от възможностите на проекта - дава информация за морфологията на думите, прави проверка на правописа и др.

В началните си версии grammar-bg ползваше базата данни от bgoffice (http://bgoffice.sourceforge.net), но в момента, след развитието, което получи Речник на българския език използва неговата база данни.

Изтегляне на необходимите файлове

Изходния код на grammar-bg се публикува в github.com.
За функциите показване на синоними и превод на английски са необходими речниците bg-en и thesaurus от bgoffice, които се доставят с изходния код на grammar-bg, но най-новите им версии може да се изтеглят SVN хранилището на bgoffice.
За да може да компилирате grammar-bg, трябва преди това да сте изтеглили и инсталирали Qt Open Source.

Информация на български за работа с Qt има в книгата "Програмиране с Qt".

Компилиране

Изходният код на grammar-bg може да изтеглите от https://github.com/vanyog/grammar-bg във вид на ZIP файл (през бутона "Clone or Download" -> "Download ZIP" на страницата в GitHub), чрез програма Git клиент или директно с Qt Creator.

След като вече разполагате с изходния код, в Qt Creator отворете файл grammar-bg.pro и потвърдете с "Configure project" създаването на целеви комплект за средата на Вашия компютър.

За да може компилираната програма да намери файловете с данни, в Qt Creator, щракнете Projects и след това върху страница Run на целевия комплект. Срещу Working Directory щракнете Choose... и изберете за работна директория, директорията с код, в която се намира поддиректорията с данни data.

За компилиране и стартиране на програмата, щрекнете бутона Run с форма на зелен триъгълник.

Забележка:

При първото стартиране grammar-bg подрежда по азбучен ред кореновите форми, а когато щракнете бутона "Всички словоформи" се подреждат по азбучен ред и всички словоформи. Подреждането може да продължи до няколко минути на по-бавни компютри, но след като бъде извършено, редът на думите се записва в два файла - roots.dat и forms.dat и при следващи стартирания се чете от там, което става многократно по-бързо.

Публикувани досега версии

31 март 2013 г. - версия 2.0
През изминалото от публикуването на предишната версия време по програмата се работеше и новата версия съдържа следните новости:

  • Като източник на данни се използват .csv файлове с таблици от базата данни на проекта Речник на българския език.
  • В допълнителен файл w_words_local.csv се добавят липсващи в Речник на българския език думи. (Бутон: "Добавяне".)
  • Добавена е правописна проверка на текстов файл с UTF-8 кодиране. (Меню: "Инструменти - Правописна проверка на файл (UTF-8)")
  • Думите от проверявания текст се показват в списъка вдясно.
  • Програмата може да маркира думите от проверявания текст, които имат определена морфологична характеристика, например: част на речта, лице, число и т.н. (Характеристиката и нейната стойност се задават с падащите списъци вдясно

21 май 2008 г. - версия 1.0

  • Най-съществената новост - проверка на правописа. Може да се проверява, копиран в клипборд текст, или текстов файл с кодировка Windows 1251.
  • Превод на дума английски.
  • Показване на синонимите.

26 февруари 2008 г. - версия 0.3
Вече са реализирани и опциите за търсене на думи, които се "състоят от" определени части, както и "запис във файл" на всички намерени думи. Направени са малки подобрения в интерфейса.

16 февруари 2008 г. - версия 0.2
В тази версия е добавена функция за търсене на думи. След избиране на "Редактиране" -> "Търсене" от главното меню, се показва диалог, в който можете да напишете отделни букви, срички или въобще части, които трябва да съдържа търсената дума. Последните трябва да са отделени с интервали. Търсенето се осъществява след щракването на бутона "Следващо търсене". Предстои да бъдат добавени още възможности за търсене.

25 ноември 2007 г.
Следваща версия, носеща вече номер 0.1, позволява запис на показвания списък от основни форми на думите или списък от всички словоформи от речниците на bgoffice в .txt файл.

14 март 2007 г.
Първа, публикувана версия на проекта представлява програма с графичен интерфейс, която: чете информацията от файловете на data директорията на bgoffice и показва списък на кореновите или производни форми на описаните в тези файлове думи. Показва също и съдържащата се в тези файлове граматическа информация за различните словоформи. Практическа полза от програмата в този вид може да има от това, че позволява лесно да се намират различни словоформи и да се провери коректността на информацията за тях.

Автор на проекта:
Ваньо Георгиев
vanyog.com

 

Същата тема в Google