Kubuntu - една добра алтернатива на Windows

ноември 29, 2008 от Васил Тошков · 13 коментара
Категории: Другo, Лични 

От няколко години се опитвам да мина изцяло на Open Source. С времето изчистих програмите, с които работя, да са само Open Source. Трудно ми беше, но го постигнах за изключително кратко време. Резултатът беше, че значително повиших продуктивността си и си спестих адски много нерви с комерсиални приложения.

Единственото комерсиално приложение ми остана операционната система - Windows. Правил съм няколко опити да мина на Linux, но все неуспешни - винаги нещо ми липсваше. Дори в университета имахме курс по Linux и пак не можах да се прехвърля. Липсващи драйвери, трудна кирилизация, много бяха проблемите.

Вчера реших на стария лаптоп да сложа Kubuntu, така или иначе го използвам само за браузване в Интернет. Бях много приятно изненадан - имаше много промени в сравнение с преди. Опозна ми всички устройства, дори допълнителните бутони на клавиатурата. Имаше Българска фонетична клавиатура и други благинки.

Сега никой не може да ме накара да седна на Windows. Направих си системата перфектна и колкото и да е банално - старата барака върви по-бързо от новия ми такъв с XP. За Vista не искам да говоря. Сложих си Firefox, FileZilla, PHP редактор, някой фонтове от Windows и общо взето от това имам нужда. Има лесен инсталатор на програми.

Сега остава да измисля начин да сложа Kubuntu и на малкия ми Asus EEE PC. Но на него имам няколко проекта на Java и .NET, които трябва да представя и забърсвам всичко. Началото ще е трудно, но няма как. Не ми се робува повече на Microsoft, да им слагам по 4Gb рам, за да работя нормално.

Опитайте Kubuntu - лесно е и безплатно. Щом аз се оправям, значи всеки може. Не знам нито една команда още и разчитам на графичната среда. Може да го пуснете и без да го инсталирате. На сайта им има опция да Ви изпратят безплатно CD, дори пакет дискове, за да раздавате. Аз преди съм поръчвал и пристигаха, сега отново си поръчах новата версия.

Приятно прекарване в една сигурна, некомерсиална и стабилна среда :)

Извличане на ключови думи/фрази от текст

ноември 22, 2008 от Васил Тошков · Коментирай
Категории: Другo 

Този текст е част от един мой проект по Компютърна лингвистика. Смятам, че може да е полезен за някой. До известна степен има общо с тематиката на блога. За останалите - не му обръщайте особено внимание.

Необходимост и приложения

Извличането на ключови думи от текст е една реална лингвистична задача, която няма еднозначно решение. Ключова дума/фраза е до известна степен относително понятие, което характеризира дума/фраза, която има значителна тежест в текста. Ключовите думи са ни необходими при решаването на редица задачи, ето някои от тях:

- синтезиране на текст
- търсене на текст от търсачки
- оптимизация на текст за търсачки
- преразказване на текст
- смяна на основните думи на текст с техни синоними
и т.н. …

Често срещани проблеми

Обикновено ключовите думи/фрази са тези думи/фрази, които се повтарят най-често в текста. Но това не е достатъчно условие за тяхното разпознаване. Тук фактор се оказва авторът на текста, като неговият стил може да е такъв, че той да не повтаря достатъчен брой пъти обектите, които целим. Също така авторът може да използва синоними и различни форми и членуване на думите.

При създаването на система, която да извлича ключовите думи от текст, трябва да се имат предвид тези и други факти (специални случаи). Текстовете се различават по размер, тематика, гъстота и разпределение на ключовите думи, и др. показатели. Много често ключовите думи и фрази са именувани обекти от думи или словосъчетания, които не се срещат като думи в речник или някаква база данни.

Примери:
- “Киров ООД”
- “Байкал пропърти груп”
- “Asus EEE PC 1000 H”
- “Историята на Google”
и т.н. …

Една система за извличане на подобни обекти трябва да разпознава и такива думи/словосъчетания. Друг често срещан проблем е кодировката на файла, от който ще бъде извличан текста, както и кодировката на знаците във файла. Ако документът е в Интернет, което е най-често срещаният пример, възможни кодировки за България са: UTF-8,CP1251,KOI8R … общо 12 кодировки само на Кирилица.

Основни принципи и технологии

В общия случай приемаме, че ключовите думи са такива думи/фрази, които се повтарят повече или поне един път в текста. Също така приемаме, че думите/фразите в заглавието на текста са ключови думи, ако те в оригиналната си и/или друга форма се съдържат в самия текст. Задължително подлагаме на подробен анализ и думи/фрази в текста, които са форматирани по различен начин.

Различните видови маркировки са: удебелен шрифт, наклонен шрифт, подчертаване, текст на връзка (при xHTML документи), “текст в кавички” (може да са единични, двойни, Word формат или общо над 8 вида), текст от подзаглавие (независимо от нивото на подзаглавието) и т.н. Често текстовете имат и синтезиран индекс на съдържанието, който съдържа предимно ключови думи.

Психологическият фактор

От психологическа гледна точка е доказано, че ключовите думи имат най-голяма гъстота в началото и в края на текста. Причината е, че често, когато авторът започне да пише по дадена тема, той излага фактите и термините в началото, които най-често са ключовите думи. Към средата на текста обикновено настъпва “разсейване”, при което тематиката частично убягва.

Следователно, средната част на текста най-малко ни интересува при един подробен анализ. Към края на текста, авторът, в общия случай, се връща към основната тематика на текста и отново и несъзнателно увеличава честотата на повтаряне на ключови думи/фрази. Най-важната част на текста обаче си остава началото, където трябва да се съсредоточат най-много ресурси при анализ.

Този принцип важи само при обемни текстове - над 800 думи. При малки текстове се приема, че ключовите думи са разпределени равномерно из целия текст. Разбира се, логично е в началото на текста те да са повече. Възможно е текстът да съдържа въвеждащ увод, който при всяко положение е богат на ключови думи.

Психологически е доказано и, че всяка ключова дума се среща поне два пъти в едно или две съседни изречения. Хората пропускат използването на местоимения и това спомага за този факт. Тоест, за да докажем, че една дума е ключова, тя не само трябва да се повтаря в началото на текста, но задължително трябва да има такова повторение, че думите да са в непосредствена близост.

SuperHosting.BG - Безплатен ваучер за Adwords

ноември 5, 2008 от Васил Тошков · 3 коментара
Категории: Другo 

Преди малко получих следното съобщение на електронната си поща:

Уважаеми(a) Васил Тошков,

Благодарим Ви, че избрахте услугите предлагани от SuperHosting.BG. Имаме удоволствието да Ви съобщим, че според условията на съвместната промоция на СуперХостинг.БГ и Google Вие, като наш клиент, имате възможността да проведете таргетирана рекламна кампания на Вашия уеб сайт в системата Google Adwords. При рекламната кампания в Google Вашите реклами ще се показват в категорията “Спонсорирани връзки” в най-популярната Интернет търсачка в света, както и в партньорската мрежа на Google.

Рекламната кампания в Google AdWords е ефективна и лесна за проследяване. За да рекламирате посредством Google Adwords e достатъчно да опишете своя бизнес с няколко думи, от които да създадете рекламна кампания и да стартирате в рамките на няколко минути. Сега СуперХостинг.БГ има възможността да Ви предостави безплатен ваучър за реклама в системата на “Google AdWords”.

За да получите Вашия ваучър за “Google AdWords” е необходимо да влезете в своя клиентски профил на нашия уеб сайт и да изберете линк-а “Google AdWords” и следвайте инструкциите, описани на тази страница.

Стойността на ваучърите се определя в зависимост от избрания хостинг план, както следва:
- за хостинг план СуперХостинг и СуперПро: 100.00 лв.
- за хостинг план СуперСтарт: 50.00 лв.

Повече информация за това, с какво рекламата в “Google AdWords” е
по-ефективна, както и условията за ползване на бонус ваучър, можете да
намерите на нашия уеб сайт на адрес:
http://www.superhosting.bg/google-adwords.htm

Надяваме се, че ваучърът, който ще Ви предоставим, ще спомогне за допълнителна популяризация на избран от Вас уеб сайт и ще повиши многократно ефективността на присъствието му в Интернет.

Помислих, че е само за нови клиенти, но уви, изпратиха ми ваучер. Едно голямо БЛАГОДАРЯ за това, че им пука за клиентите си. superhosting.bg и hostbulgaria.com (inbg.eu), са ми любимите хостинг компании.

Следваща страница »