📊 Neon Batch Processor + LEADY Integrace¶
Datum: 2026-01-16 Status: ✅ AKTIVNÍ
🎯 Účel¶
Paralelní zpracování 58,995 reality záznamů z Neon PostgreSQL databáze s: - ML cenovými predikcemi (R² = 0.68) - LEADY štítkovacím systémem (8 kategorií, max 800 bodů) - 10 paralelních workerů - Excel output (10 worker souborů + 1 merged)
🗄️ Neon Databáze¶
Connection:
postgresql://neondb_owner:npg_dcVAU8FSj6Ym@ep-solitary-rain-ah038yz7.c-3.us-east-1.aws.neon.tech/neondb?sslmode=require
Tabulky: - Opportunity (58,995 záznamů) - reality data s LEADY štítky - Broker, Source, LocalPriceStats
Opportunity sloupce: - id, title, description, url - addressRaw, addressNorm, lat, lon - askPriceCzk, floorAreaM2, avmPriceCzk, marketPriceCzk, deltaPct - propertyType, sourceType - LEADY: discountTag, legalState, occupancy, conditionState, strategy
🤖 Batch Processor¶
Soubor: batch_processor_neon.py Workery: 10 paralelních procesů Rychlost: ~120,000 inzerátů/min
Funkce: 1. Připojení k Neon PostgreSQL 2. Rozdělení 58,995 záznamů na 10 chunků 3. ML price prediction (czech_property_ai_model.pkl) 4. Integrace LEADY štítků (existujících + nových) 5. TOTAL_SCORE výpočet (max 800) 6. AI recommendation 7. Export do 10 Excel souborů + merged
🏷️ LEADY Systém (8 kategorií)¶
| Kód | Kategorie | Max body | Příklady |
|---|---|---|---|
| SRC | Source | 100 | EXE=100, INS=95, SR=75 |
| ASSET | Asset Type | 10 | BYT=10, RD=9, KOM=8 |
| DISC | Discount | 100 | D50=100, D40=90, D30=80 |
| LEG | Legal | 100 | CLR=100, VB=80, ZAL=70 |
| OCC | Occupancy | 100 | VOL=100, V30=90, V90=80 |
| COND | Condition | 100 | NOV=100, DOB=90, OBY=80 |
| URG | Urgency | 100 | NOW=100, W1=80, FLEX=50 |
| STRAT | Strategy | 100 | FLIP=100, DEV=90, RENT=80 |
Lead Code: {DISC}-{ASSET}-{LEG} Příklad: D50-BYT-CLR = Podhodnoceno 50%, byt, právně čistý
📂 Output Struktura¶
C:/Users/info/Downloads/NEON_WORKERS/
├── WORKER_1_NEON_DATA.xlsx (5,899 záznamů)
├── WORKER_2_NEON_DATA.xlsx (5,899 záznamů)
├── ...
└── WORKER_10_NEON_DATA.xlsx (5,904 záznamů)
C:/Users/info/Downloads/NEON_REALITY_ML_COMPLETE.xlsx (58,995 záznamů merged)
Excel sheets: - 🎯 MASTER_DATA - všechna data seřazená podle TOTAL_SCORE - ⭐ TOP_100 - top 100 příležitostí - 💎 D50, 💎 D40, 💎 D30, 💎 D25, 💎 D20 - podle discount kategorie - 📊 STATISTIKY - agregované statistiky
🔗 Související Dokumenty¶
- SESSION_2026-01-16_NEON_BATCH_PROCESSOR.md - Detailní záznam
- API_INFO.md - Neon credentials + Crawl4AI
- 10 SWARM složek - Scraper groups
Vytvořeno: 2026-01-16 Autor: Claude Code