Skip to content

📊 Neon Batch Processor + LEADY Integrace

Datum: 2026-01-16 Status: ✅ AKTIVNÍ


🎯 Účel

Paralelní zpracování 58,995 reality záznamů z Neon PostgreSQL databáze s: - ML cenovými predikcemi (R² = 0.68) - LEADY štítkovacím systémem (8 kategorií, max 800 bodů) - 10 paralelních workerů - Excel output (10 worker souborů + 1 merged)


🗄️ Neon Databáze

Connection:

postgresql://neondb_owner:npg_dcVAU8FSj6Ym@ep-solitary-rain-ah038yz7.c-3.us-east-1.aws.neon.tech/neondb?sslmode=require

Tabulky: - Opportunity (58,995 záznamů) - reality data s LEADY štítky - Broker, Source, LocalPriceStats

Opportunity sloupce: - id, title, description, url - addressRaw, addressNorm, lat, lon - askPriceCzk, floorAreaM2, avmPriceCzk, marketPriceCzk, deltaPct - propertyType, sourceType - LEADY: discountTag, legalState, occupancy, conditionState, strategy


🤖 Batch Processor

Soubor: batch_processor_neon.py Workery: 10 paralelních procesů Rychlost: ~120,000 inzerátů/min

Funkce: 1. Připojení k Neon PostgreSQL 2. Rozdělení 58,995 záznamů na 10 chunků 3. ML price prediction (czech_property_ai_model.pkl) 4. Integrace LEADY štítků (existujících + nových) 5. TOTAL_SCORE výpočet (max 800) 6. AI recommendation 7. Export do 10 Excel souborů + merged


🏷️ LEADY Systém (8 kategorií)

Kód Kategorie Max body Příklady
SRC Source 100 EXE=100, INS=95, SR=75
ASSET Asset Type 10 BYT=10, RD=9, KOM=8
DISC Discount 100 D50=100, D40=90, D30=80
LEG Legal 100 CLR=100, VB=80, ZAL=70
OCC Occupancy 100 VOL=100, V30=90, V90=80
COND Condition 100 NOV=100, DOB=90, OBY=80
URG Urgency 100 NOW=100, W1=80, FLEX=50
STRAT Strategy 100 FLIP=100, DEV=90, RENT=80

Lead Code: {DISC}-{ASSET}-{LEG} Příklad: D50-BYT-CLR = Podhodnoceno 50%, byt, právně čistý


📂 Output Struktura

C:/Users/info/Downloads/NEON_WORKERS/
├── WORKER_1_NEON_DATA.xlsx  (5,899 záznamů)
├── WORKER_2_NEON_DATA.xlsx  (5,899 záznamů)
├── ...
└── WORKER_10_NEON_DATA.xlsx (5,904 záznamů)

C:/Users/info/Downloads/NEON_REALITY_ML_COMPLETE.xlsx (58,995 záznamů merged)

Excel sheets: - 🎯 MASTER_DATA - všechna data seřazená podle TOTAL_SCORE - ⭐ TOP_100 - top 100 příležitostí - 💎 D50, 💎 D40, 💎 D30, 💎 D25, 💎 D20 - podle discount kategorie - 📊 STATISTIKY - agregované statistiky


🔗 Související Dokumenty


Vytvořeno: 2026-01-16 Autor: Claude Code