Онтотекст: Търговският регистър е добре

а предстоящия първи у нас Datathon компанията предизвиква ИТ специалистите да преобразуват данните от регистъра в свързани отворени данни, а не да атакуват неговите системи
по статията работи: biznews.bg
Онтотекст: Търговският регистър е добре

"Да хакнем Търговския регистър" - това заглавие се завъртя в медиите преди няколко дни във връзка с първото за Централна и Източна Европа практическо предизвикателство за обработка и анализ на данни Datathon, в което българската софтуерна компания Онтотекст ще помогне на екипи да представят силата на свързаните отворени данни.

Освен интерес към събитието, заглавието предизвика и известни притеснения. А някои читатели са видяли в него заплаха за българския Търговския регистър. В тази връзка бързаме да успокоим всички: Търговският регистър е добре, неговите системи за сигурност работят ефективно и той не е заплашен по никакъв начин.

Малко повече за понятията хаквам и хакер

Думата "хаквам" може да означава много неща. Макар и през последните години за мнозина тя да носи негативното значение, свързано с непозволено проникване в компютърна система, все пак ще припомним, че още със своето възникване тя е натоварена по-скоро с позитивното значение - "измислям работещо решение". И макар в медиите хакерите да са придобили популярност по-скоро като хора, извършващи компютърни престъпления, все още в технологичните среди по-често това понятие се използва по-скоро в позитивен контекст на някой, който открива нови начини за извършването на дадена задача.

За "хакването" на Търговския регистър

Държим да уверим загрижените граждани, че Онтотекст използва думата изцяло в позитивното й значение. Целта на задачата, поставена от Онтотекст в предстоящия днес Datathon 2017 е преобразуването на данни от търговския регистър във формат, удобен да се използва за свързване на отворени данни (Linked Open Data).

По този начин, с използването на графови бази от данни, ще могат да се разкрият взаимовръзки и да се изведат скрити факти от данните, като например:

- идентифициране и класификация най-големите групи от свързани фирми в България или в определен район.

- board-walk: анализиране как съвместното участие на директори в бордове на различни фирми се отразява на сферите им на влияние.

В този смисъл "хакване” за нас има смисъл на "намиране на по-ефективно решение”. Нещо повече - участието на Онтотекст в Datathon събитието се извършва в пълна координация с Агенцията по вписванията. То няма да засегне по никакъв начин реалното функциониране на Търговския регистър, а ще спомогне за създаването на нови модели, които да подобрят функционирането му в бъдеще.

Задачата на Онтотекст

Задачата на Онтотекст ще покаже как един голям набор от изключително сложни данни (тези на Търговския регистър), които в момента са организирани като набор от ежедневни актуализации в XML файлове - могат да бъдат агрегирани и превърнати в LOD формат, който да е достъпен, отворен (основан на отворени стандарти и препоръки от W3C) и свързан (връзки между фирми, управители, собственици, адреси и населени места).

За събитието

Dathaton Bulgaria ще се проведе между 24 март и 26 и ще награди отборите, стигнали до най-прецизно, креативно и елегантно решение на проблемите, свързани с обработка и анализ на данни.

 реклама