Kolege iz bivše firme su imali genijalnu ideju za sve i svašta vući pdoatke sa web-a. Naravno, ne kroz servise tipa SOAP-a. ili preko REST-a. negu upravo kako i zamišljaš - parsirajući HTML.
Nakon nešto vremena ili su završili na blacklistama servera (valjda po identifikaciji clienta), a jednog dana su dobili i "pravno formulirano upozorenje". Na kraju su odsutali od te "igračke".
Direktno uglavnom možeš raditi s nekim cachiranim podacima (npr. tečajna lista, vremenska prognoza i sl.), no za direktne upite vjerojatno trebaš ozbiljniji pristup i dogovor.
Toplo ti preporučujem direktan kontakt sa programerima i dobar dogovor oko toga što se i koliko smije koristiti. Sve što je ozbiljno i "valja" ima već riješen neki od oblika web servisa gdje izbjegavaš parsiranje i triper kombinacije koje će se raspasti kod slijedećeg redizajna stranice ili malo igranja kôdom.
God is real unless is declared as integer.