Az adatokat a Precognox gyűjtötte, Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) licenc alatt áll, azaz kutatási és magán céllal szabadon felhasználható, de kereskedelmi felhasználása a tulajdonos engedélye nélkül tilos. A felhasználás feltétele az eredeti forrás és jogtulajdonos megjelölése.
Hivatkozási minta:
Ingatlan adatok: http://opendata.hu/dataset/magyarorszagi-ingatlanhirdetesi-adatok a Precognox gyűjtése az ingatlan.com-ról
Adatgyűjtés ideje: 2018.03.02-2018.03.03
Típusa: Teljes keresztmetszeti gyűjtést készítettünk, az adatgyűjtés időpontjában elérhető összes hirdetést legyűjtöttük az ingatlan.com oldaláról.
Állományok: Összesen négy különálló csv file-ban érhetők el adatok, melyek a következőek:
-
elado_haz.csv (eladó házak hirdetései)
-
elado_lakas.csv (eladó lakások hirdetései)
-
kiado_haz.csv (kiadó házak hirdetései)
-
kiado_lakas.csv (kiadó lakások hirdetései)
Alapvetően a hirdetésekben rejlő összes elérhető információt legyűjtöttük: a házak/lakások jellegzetességeit (ár, négyzetméter, fűtés stb.) s a leírásokat egyaránt. Utóbbiakat fel is dolgoztuk: a szöveges leírásokat szavakra s azokat szótövekre bontottuk.
Fontos megjegyezni, hogy a négy file-ban nem teljesen ugyanazok a változók – ennek legfőbb oka, hogy néhány jellegzetesség, ami adott típusú hirdetésekben előfordul, másoknál nem jellemző (pl. házaknál van telekméret, lakásoknál nincs).
Az adatállományok kódolása: UTF-8
Hiányzó értékek: Amennyiben 1-1 jellegzetességnél a hirdetésekben nem adtak meg értéket – például a hirdető nem nyilatkozott a parkolási lehetőségekről stb., ott a cellák üresek.