"Да хакнем Търговския регистър" - това заглавие се завъртя в медиите преди няколко дни във връзка с първото за Централна и Източна Европа практическо предизвикателство за обработка и анализ на данни Datathon, в което българската софтуерна компания Онтотекст ще помогне на екипи да представят силата на свързаните отворени данни.
Освен интерес към събитието, заглавието предизвика и известни притеснения. А някои читатели са видяли в него заплаха за българския Търговския регистър. В тази връзка бързаме да успокоим всички: Търговският регистър е добре, неговите системи за сигурност работят ефективно и той не е заплашен по никакъв начин.
Малко повече за понятията хаквам и хакер
Думата "хаквам" може да означава много неща. Макар и през последните години за мнозина тя да носи негативното значение, свързано с непозволено проникване в компютърна система, все пак ще припомним, че още със своето възникване тя е натоварена по-скоро с позитивното значение - "измислям работещо решение". И макар в медиите хакерите да са придобили популярност по-скоро като хора, извършващи компютърни престъпления, все още в технологичните среди по-често това понятие се използва по-скоро в позитивен контекст на някой, който открива нови начини за извършването на дадена задача.
За "хакването" на Търговския регистър
Държим да уверим загрижените граждани, че Онтотекст използва думата изцяло в позитивното й значение. Целта на задачата, поставена от Онтотекст в предстоящия днес Datathon 2017 е преобразуването на данни от търговския регистър във формат, удобен да се използва за свързване на отворени данни (Linked Open Data).
По този начин, с използването на графови бази от данни, ще могат да се разкрият взаимовръзки и да се изведат скрити факти от данните, като например:
- идентифициране и класификация най-големите групи от свързани фирми в България или в определен район.
- board-walk: анализиране как съвместното участие на директори в бордове на различни фирми се отразява на сферите им на влияние.
В този смисъл "хакване” за нас има смисъл на "намиране на по-ефективно решение”. Нещо повече - участието на Онтотекст в Datathon събитието се извършва в пълна координация с Агенцията по вписванията. То няма да засегне по никакъв начин реалното функциониране на Търговския регистър, а ще спомогне за създаването на нови модели, които да подобрят функционирането му в бъдеще.
Задачата на Онтотекст
Задачата на Онтотекст ще покаже как един голям набор от изключително сложни данни (тези на Търговския регистър), които в момента са организирани като набор от ежедневни актуализации в XML файлове - могат да бъдат агрегирани и превърнати в LOD формат, който да е достъпен, отворен (основан на отворени стандарти и препоръки от W3C) и свързан (връзки между фирми, управители, собственици, адреси и населени места).
За събитието
Dathaton Bulgaria ще се проведе между 24 март и 26 и ще награди отборите, стигнали до най-прецизно, креативно и елегантно решение на проблемите, свързани с обработка и анализ на данни.