O projekte Bizdata.sk
Trochu z histórie ..
Portál bizdata.sk vznikol ako podporný projekt pre ipdf.sk - portálu pre tvorbu elektronických tlačív a formulárov. Užívateľská prívetivosť formulárov vyžaduje umožniť užívateľom vyhľadanie a vloženie adresy a základných identifikačných údajov firiem a podnikateľov. Cieľom projektu bizdata.sk bolo vyriešiť tento problém, ktorý sa rôznymi pokusmi o napojenie na štátom prevádzkované služby nepodarilo v priebehu niekoľkých rokov uspokojivo vyriešiť.
Nedostatočným riešením sa ukázalo napojenie na načítavanie údajov z Obchodného registra , nakoľko tento neobsahuje údaje o živnostníkoch. Napísanie parsera pre Živnostenský register nemalo zmysel, nakoľko Živnostenský register nepodporuje trvalé linky (permalinks). Vhodný riešením sa zdal prechod na službu registeruz.sk v roku 2016, ktorá vznikla v rámci iniciatívy zvýšenia transparentnosti podnikateľského prostredia. Napriek dobrému výkonu servera a verejne dostupnému API rozhraniu však služba dlhodobo vykazuje občasné výpadky v nepredvídateľnom čase a dĺžke. A napokon sme nevyužili ani jedinú komerčne dostupnú službu Finstat.sk , pretože portál ipdf.sk by to pri súčasnej cenovej politike dlhodobo neutiahol.
V máji 2021 preto došlo ku rozhodnutiu pokúsiť sa vytvoriť vlastné riešenie, ktoré skonsoliduje údaje z verejne dostupných služieb do spoločnej databázy a v prípade úspechu ponúknuť službu aj ďalším záujemcom. Samotný vývoj aplikácie trval približne jeden rok a ku prvému spusteniu služby došlo v júli 2022.
Hoci spustenie aplikácie a napojenie portálu ipdf.sk bolo úspešné, časom sa vyskytli nečakané komplikácie. Po niekoľkých mesiacoch sme napríklad museli server kompletne reinštalovať a zmeniť typ súborového systému (na xfs). Zmeny nastali časom aj v načítavaných zdrojoch dát - napríklad register účtovných závierok začal v dôsledku legislatívnych zmien skrývať určité typy údajov, ktoré boli v predošlých rokoch dostupné. Mnoho subjektov sa taktiež stalo spätne nedohľadateľnými pridaním nových statusov alebo zmazaním z titulu "ex offo", čo svedčí o dobovo dominujúcich politických záujmoch. Došlo tiež ku "technických prekvapeniam" - napríklad ku nekonzistentnému prideľovaniu identifikátorov subjektom, čo si vynútilo prepísanie časti jadra aplikácie. Pribudli obsahové chyby - napríklad nesprávne vyhodnocovanie vzniku a zániku subjektu pri interpretácii dátumov prerušenia podnikateľskej činnosti ako aj množstvo pravopisných preklepov. Stovky záznamov majú odseknuté časti názvov príliš dlhých obcí. Dvakrát sme museli prepísať parser živnostenského registra a opätovne stiahnut z neho údaje, čo nie je práca na jeden ani tri dni. Obchodný register zaviedol časom obmedzenia na počet požiadaviek za doteraz nejasných pravidiel, takže aj dnes server bežne nevráti odpoveď ani pre platné subjekty. Bolo potrebné upraviť aplikáciu tak, aby sa pokúsila opätovne stiahnuť chýbajúce údaje.
Vyriešenie uvedených problémov bolo neraz časovou a technickou výzvou a dôsledkom toho bol odsun spustenia aplikácie až do druhej polovice roka 2024.