Jak działa Unitrank
Techniczna notatka o źródłach danych, modelowaniu i znanych ograniczeniach. Ostatnia aktualizacja May 2026.
Unitrank szereguje każdą kawalerkę/mieszkanie według tego, ile kosztuje Twoje codzienne życie. Nie chodzi tylko o czynsz: dojazd, hałas, dostęp do sklepów spożywczych, jakość miejsca do pracy i każda inna codzienna aktywność. Mieszkanie, które kosztuje Ci najmniej minut dziennie, zajmuje pierwsze miejsce.
Wyniki są spersonalizowane pod Twoją lokalizację pracy, skład gospodarstwa domowego, dochód i styl życia. Ponieważ agregujemy dane ze wszystkich głównych platform, algorytm porównuje Airbnb w Palermo z bezpośrednim najmem na Argenprop, tymczasowym ogłoszeniem na Zonaprop oraz mieszkaniem wystawionym przez właściciela na MercadoLibre na równych zasadach: ten sam model kosztów, ten sam sposób liczenia dojazdu, ten sam wynik oceny hałasu.
1. Dlaczego to trudniejsze, niż wygląda
Dane o mieszkaniach nie są „czystym” zbiorem danych. To wrogie, stale pogarszające się środowisko.
Ogłoszenia szybko się dezaktualizują. Ceny się zmieniają. Zdjęcia są wymieniane, czasem na obrazy starszych lokali lub na ujęcia stylizowane, które nie odzwierciedlają tego, w co faktycznie wejdziesz. Ten sam lokal pojawia się na dwóch–trzech platformach z różnymi cenami, różną liczbą sypialni, a czasem też z innymi współrzędnymi. Kategorie używa się luźno: „1 bedroom”, „studio”, „temporary”, „furnished” i „dueño directo” oznaczają różne rzeczy w zależności od źródła, a czasem nawet różne rzeczy w obrębie tego samego źródła. Prowizje, opłaty budynkowe, założenia dotyczące mediów i koszty gwarancji najmu są często ukryte, „zmiękczone” albo wspominane dopiero po pierwszym kontakcie.
Bez korekt rozbijają się nawet podstawowe porównania. Ogłoszenie, które wygląda na tanie, może okazać się droższe od sąsiada po doliczeniu opłat budynkowych, mediów, zamortyzowanej gwarancji najmu i prowizji pośrednika. Ogłoszenie podobne na papierze może w praktyce oznaczać bardzo inne mieszkanie, budynek lub sytuację życiową.
Dlatego wyszukiwanie mieszkań nie jest problemem bazodanowym. To ciągły proces: wprowadzanie danych, deduplikacja, normalizacja, wyciąganie brakujących atrybutów, weryfikacja i korekta względem rynku, który jest „głośny”, strategiczny i aktywnie się zmienia pod powierzchnią danych.
2. Dlaczego preferencje nie są dosłownymi filtrami
Standardowe portale traktują preferencje jak czyste, binarne filtry. Prawdziwe intencje najemcy nie są tak proste.
Gdy ktoś mówi „budżet $1,200”, może chodzić o maksymalny czynsz reklamowany, maksymalny prawdziwy koszt „all-in”, wygodny cel, który „elastycznie” wzrasta, jeśli mieszkanie wyraźnie jest lepsze, albo o liczbę, która przesuwa się wraz z tym, jak poprawia się dojazd lub jak rośnie/zmienia się wyposażenie. Kiedy ktoś mówi „blisko pracy”, może mieć na myśli dystans do przejścia pieszo, krótki przejazd metrem albo po prostu „nie da się wykończyć do końca tygodnia”. „Umeblowane” może oznaczać pełną gotowość do wprowadzenia się albo „ma łóżko”. „Bezpieczne” może znaczyć niski poziom przestępczości, cichsze ulice, lepsze utrzymanie albo po prostu barrio, które wydaje się spokojniejsze.
Dwoje najemców może podać identyczne informacje i chcieć zupełnie innych rezultatów. Dwa identyczne mieszkania mogą być właściwym wyborem dla jednego gospodarstwa domowego i złym dla innego. Powód jest prosty: preferencje są skompresowanymi wyrażeniami kompromisów (czas kontra pieniądze, wygoda kontra cena, jakość kontra tarcie), a tych kompromisów nie da się uchwycić przez dosłowne dopasowanie etykiety.
Dlatego Unitrank traktuje wiele preferencji jako sygnały interpretowane. Ocena rankingu rozważa kompromisy w odniesieniu do konkretnego gospodarstwa domowego, długości pobytu, dochodu i stylu życia — nie tylko do słów wpisanych w filtr.
3. Co mierzymy
Każde mieszkanie jest oceniane we wszystkich 21 wymiarach życia. Każdy z nich to codzienna lub tygodniowa aktywność, którą Twoje mieszkanie ułatwia albo utrudnia.
| Kategoria | Wymiary | Co to oddaje |
|---|---|---|
| Schronienie | Mieszkanie, Sen, Higiena, Przechowywanie | Czynsz, jakość łóżka, dostęp do łazienki, miejsce w szafach |
| Produktywność | Skupienie, Sprzątanie, Pranie | Jakość miejsca do pracy, czas utrzymania gospodarstwa domowego |
| Forma | Cardio, Siła | Dostęp do siłowni, bliskość parku, udogodnienia w budynku |
| Jedzenie | Posiłki, Zakupy spożywcze | Jakość kuchni, bliskość supermarketu, opcje restauracji |
| Życie towarzyskie | Networking, Randki, Rozrywka | Wspólna przestrzeń do pracy (coworking), restauracje, dostęp do nocnego życia |
| Rodzina | Opieka nad dziećmi, Szkoła, Opieka nad psem | Autoaktywacja w zależności od składu gospodarstwa domowego |
| Dobre samopoczucie | Zadowolenie | Komfort psychiczny skalowany dochodem |
Żaden pojedynczy wymiar nie dominuje rankingu. Wygrywa mieszkanie, w którym wszystkie 21 wymiary razem kosztują Ci najmniej.
Dla każdego wymiaru rywalizuje wiele strategii. Mieszkanie z basenem może „ominąć” dojazd do siłowni przy cardio. Bez biurka uwzględniasz koszty coworkingu. Gotuj w domu, jedz na mieście albo zamawiaj dostawy: wszystkie trzy strategie konkurują o każdy posiłek, a zwycięża najtańsza.
W wymiarach z wieloma pobliskimi opcjami wyjazdy rozkłada się pomiędzy rywalizujące miejsca, ważone odległością i jakością. Bliższy, lepiej zaopatrzony supermarket przechwytuje więcej Twoich zakupów niż daleki sklep osiedlowy. Śniadanie, lunch i kolacja są modelowane osobno, z różnymi preferencjami względem miejsca oraz skalowaniem pod gospodarstwo domowe.
4. Co wychwytuje algorytm
Cztery decyzje ranking podejmuje inaczej niż człowiek przeglądający ogłoszenia.
Hałas w obrębie tego samego budynku
Lokale od strony ulicy i od strony wewnętrznego dziedzińca pod tym samym adresem mogą różnić się o 15–20 dB. To różnica między spaniem w zatyczkach do uszu a spaniem w ciszy. Oba lokale mają tę samą cenę najmu. Żadna platforma tego nie rozróżnia. Ranking wie, która strona budynku wychodzi na avenida.
„Trójkąt” dojazdu
Najemca pracujący w Microcentro, z siłownią w Belgrano i dziećmi w szkole w Núñez ma trzy dojazdy, nie jeden. „Palermo jest centralne” jest prawdą ogólnie, ale nie w przypadku tego gospodarstwa domowego. Ranking znajduje mieszkanie, które minimalizuje „trójkąt” wszystkich trzech destynacji. Wybieranie Palermo tylko dlatego, że „wszyscy mówią”, że Palermo kosztuje dodatkowe 20–40 minut dziennie.
„Wtopki” z expensas
Dwa mieszkania z czynszem $800/mies. Jedno ma $50/mies. opłat budynkowych, drugie $250. Mieszkanie z $800+$250 jest droższe niż mieszkanie z $900 i $80 opłat budynkowych. Najemcy filtrują po czynszu. Ranking sortuje po koszcie „all-in”.
Umeblowane vs nieumeblowane: prawdziwe porównanie
Większość platform opisuje mieszkania jako „umęblowane” albo „nieumeblowane”, ale nigdy nie porównuje ich na równych zasadach. Ranking robi to. Liczy prawdziwy koszt nieumeblowanego mieszkania, uwzględniając zakup mebli, dostawę, montaż i utylizację przy wyprowadzce. Przy pobytach krótszych niż 12 miesięcy nieumeblowane mieszkania często kosztują więcej niż umeblowane, gdy wliczysz te ukryte koszty. Każdy użytkownik widzi porównanie oparte o faktycznie planowaną długość pobytu.
5. Kalkulacja kosztu „all-in”
Większość platform pokazuje czynsz bazowy. My pokazujemy to, co realnie płacisz co miesiąc.
| Składnik | Jak to liczymy |
|---|---|
| Czynsz bazowy | Miesięczny czynsz wg ogłoszenia. Dla Airbnb: stawka za noc × 30 + opłata za sprzątanie + opłata serwisowa |
| Expensas | Opłaty budynkowe. Rzeczywiste, jeśli podane w ogłoszeniu; w przeciwnym razie szacowane na podstawie sąsiednich lokali w tym budynku lub średnich dla barrio |
| Media | Szacowane na podstawie metrażu i liczby jednostek klimatyzacji (AC). Opieramy się na taryfach bez dopłat z Edenor, Metrogas i AySA |
| Gwarancja najmu | Seguro de caución amortyzowana co miesiąc: ~8% całkowitej wartości umowy podzielone przez liczbę miesięcy umowy. Zero dla wynajmów tymczasowych i gdy właściciel wynajmuje bezpośrednio (owner-direct) |
| Prowizja pośrednika | Amortyzowana co miesiąc. Różni się w zależności od ogłoszenia: niektórzy doliczają 1–2 miesiące, inni 0. Ogłoszenia owner-direct nie mają prowizji pośrednika |
6. Model dojazdu
Odległości pieszo i samochodem wykorzystują realistyczne trasowanie na danych drogowych OpenStreetMap. To faktyczne trasy pieszo, a nie dystanse „w linii prostej”.
| Tryb | Metoda | Parametry |
|---|---|---|
| Chodzenie | OSRM routing (silnik trasowania open-source) | 82 m/min, 5.0 km/h |
| Jazda samochodem | OSRM car routing | Uwzględnia czas parkowania i koszt paliwa |
| Subte | Rozkłady GTFS + dojście pieszo | Wejście pieszo na stację + 5 min oczekiwania + przejazd + kara za przesiadkę + dojście do celu |
| Colectivo | Częstotliwości GTFS | Wejście pieszo do przystanku + 8 min oczekiwania + przejazd przy 14 km/h |
| Pociąg | Rozkłady GTFS | Wejście pieszo na stację + 10 min oczekiwania + przejazd przy 27 km/h „all-stops” |
Odległości są wcześniej policzone dla 265 kategorii i 245k+ punktów zainteresowania: supermarketów, stacji subte, parków, siłowni, szkół, miejsc coworkingu i innych. Dla niestandardowych lokalizacji, takich jak adres pracy czy szkoły, dokładne trasy są obliczane w czasie zapytania.
7. Model hałasu
Każde mieszkanie dostaje wynik wpływu hałasu od 0 (cicho) do 100 (duża ekspozycja).
Hałas zewnętrzny: 5 źródeł
- Ruch drogowy: model hałasu drogowego CoRTN na bazie geometrii dróg z OpenStreetMap z skalibrowanymi wolumenami ruchu. Najważniejsze drogi wnoszą największy udział.
- Samoloty: tłumienie punktowe z Aeroparque. Wpływa głównie na Palermo, Belgrano i Núñez.
- Nocne życie: kluby nocne i bary w promieniu 200 m. Istotne dla Palermo Soho, San Telmo oraz dzielnic rozrywkowych.
- Przystanki autobusowe: przystanki coletivo na trasach o wysokiej częstotliwości wzdłuż głównych avenidas.
- Złożone: wszystkie 5 źródeł zsumowane w dziedzinie mocy przez dodawanie akustyczne.
Tłumienie wewnątrz
Hałas zewnętrzny jest redukowany przez obudowę budynku. Zamknięte okna z AC tłumią 14 dB. Otwarte okna bez AC tłumią 10 dB. Wiek budynku dodaje 0–3 dB, okna dwuszybowe (dwuprzyczynowe) dodają 5 dB, a uszczelnienie akustyczne dodaje 3 dB. Wartości dla otwartych okien z Locher et al. 2018 — badania 102 szwajcarskich rezydencji.
Ocenianie wpływu
Wzór: (indoor_dB - 35) / 30 × 100, ograniczony do zakresu 0–100. Bazowa wartość 35 dB leży pomiędzy zaleceniem WHO dla snu (30 dB) a standardem ASHRAE dla biur (35 dB). Sufit 65 dB to próg WHO „poważnego zagrożenia dla zdrowia publicznego”.
8. Zamiana pieniędzy na czas
Wszystkie koszty przeliczamy na minuty dziennie za pomocą wzoru, który uwzględnia zarówno siłę zarobkową, jak i psychologiczny ciężar wydatków:
minutes_per_dollar = √(labor_rate × perception_rate)
| Roczny dochód | Minuty na $1/dzień | Interpretacja |
|---|---|---|
| $20,000 | 7.21 | Każdy dolar dziennego kosztu „czuje się” jak 7 minut Twojego życia |
| $60,000 | 3.16 | Punkt odniesienia |
| $100,000 | 2.19 | Pieniądze znaczą mniej, czas znaczy więcej |
| $200,000 | 1.28 | Optymalizacja pod czas, nie pod koszt |
9. Walidacja statystyczna
Walidujemy nasz model kosztów względem cen rynkowych przy użyciu regresji hedonicznej, metody statystycznej, która izoluje premię cenową dla każdej pojedynczej cechy.
- Metoda: regresja pół-logarytmiczna z ustalonymi efektami dla siatki heksagonalnej, kontrolując lokalizację na poziomie bloku (~460 m rozdzielczości)
- Cechy: testowane jednocześnie 60+ udogodnień: basen, parking, pralka, winda, AC, miejsce do pracy, zmywarka i więcej
- R²: 0.51, wyjaśnia 51% zmienności ceny. Zgodnie z opublikowanymi badaniami hedonicznymi
- Obserwacje: 6,046 ogłoszeń z kompletnymi danymi
Gdy nasz model zgadza się z wyceną rynkową — mamy potwierdzenie. Gdy się nie zgadza — algorytm znajduje wartość, której inni nie widzą.
| Cechy | Nasza korekta | Premia rynkowa | Co to znaczy |
|---|---|---|---|
| Zmywarka | 8 min/dzień | 5.7% | Potwierdzone: rynek i model zgadzają się |
| Basen | 5 min/dzień | 18.9% | Rynek przepłaca: możesz płacić za basen, z którego rzadko korzystasz |
| Jakość miejsca do pracy | 25-75 min/dzień | ~0% | Ślepa plama rynku: gdy pracujesz z domu, algorytm znajduje niedowartościowane mieszkania z dobrym biurem |
| Hałas (dziedziniec vs ulica) | 5-15 min/dzień | Częściowo wycenione | Selekcja lokali w obrębie budynku to czysta arbitraż: ten sam budynek, inny hałas, ta sama cena |
| Bliskość parku dla psów | 4 min/dzień na każdą minutę odległości | Nie wycenione | Gdy masz psa, 14 spacerów tygodniowo sprawia, że bliskość ma wartość. Rynek to ignoruje |
Każda szansa arbitrażowa jest spersonalizowana. Przewaga w pracy zdalnej pojawia się tylko wtedy, gdy wskażesz pracę zdalną. Przewaga „park dla psów” pojawia się tylko wtedy, gdy zaznaczysz, że masz psa. Algorytm dopasowuje się do Twojego życia, a nie do przeciętnych preferencji rynkowych.
10. Źródła danych
| Źródło | Co wykorzystujemy | Wolumen | Odświeżanie |
|---|---|---|---|
| Airbnb | Ogłoszenia, ceny, recenzje, zdjęcia | 29,291 | Rotacja wyszukiwania; szczegóły dotyczące wyzwalaczy świeżości |
| Argenprop | Ogłoszenia, ceny, zdjęcia | 23,963 | Rotacja ważona poziomami; najpierw barrio klasy A |
| Zonaprop | Ogłoszenia, ceny, zdjęcia | 25,372 | Ciągłe odkrywanie; pełne skanowanie w ramach rotacji |
| MercadoLibre | Ogłoszenia, ceny, zdjęcia | 34,792 | Największy zapas ogłoszeń owner-direct wśród portali |
| OpenStreetMap | POI w 265 kategoriach | 245k+ | Okresowe odświeżanie ekstraktu |
| OSRM | Trasy piesze i samochodowe | 41,921,692 odległości | Własny serwer, przeliczane przy zmianach POI |
| GTFS | Rozkłady transportu: subte, colectivo, pociąg | 16k+ stacji | Okresowe aktualizacje rozkładów |
| Wzbogacanie LLM | Analiza zdjęć: udogodnienia, stan, metraż | ~460 faktów/lokal | Ciągłe partie; podział na tier premium/economy |
| dolarapi.com | Kurs wymiany USD/ARS | — | Na żywo |
Nowe źródła dodajemy regularnie. Każda nowa platforma zwiększa pokrycie i wzmacnia porównania międzyplatformowe.
11. Jak często odświeżamy
Świeżość danych bezpośrednio wpływa na jakość rankingu. Ogłoszenia „stare” marnują Twój czas.
- Skanowania wyszukiwań: Ciągłe per źródło. Odkrywanie „od najnowszych” plus rotujące pełne przeglądy. Nowe ogłoszenia zwykle pojawiają się w ciągu kilku godzin od publikacji.
- Weryfikacja dostępności: synchronizacja kalendarza i ponowne pobranie szczegółów przy sygnałach nieświeżości lub pominięcia w wyszukiwaniu. Brak dostępności usuwa ogłoszenia z rankingu.
- Priorytetyzacja ważona poziomami: barrio klasy A (Palermo, Recoleta, Belgrano, Núñez, Vicente López i podobne) są odświeżane przed barrio klasy B i C.
- Wzbogacanie LLM: Ciągłe przetwarzanie partiami z podziałem na tier premium/economy. Nowe ogłoszenia zwykle wzbogacane są w ciągu kilku godzin od odkrycia.
- Odbudowa rankingu: Aktualizacje przyrostowe przy każdej zmianie ogłoszenia. Pełna odbudowa nocą.
- Wyniki zaufania: Odświeżane na podstawie opinii użytkowników, wieku ogłoszenia i sygnałów weryfikacji.
- Obliczanie rankingu: Spersonalizowane wyniki w czasie poniżej 28 ms (p95), zwykle 26 ms (p50). Oceniamy wszystkie 21 wymiarów życia w pełnym wolumenie, wybieramy optymalną strategię dla każdego wymiaru w ramach danego lokalu i ujawniamy każdą decyzję wraz z pełnym rozbiciem kosztów. Liczone na żądanie, nie wstępnie cache’owane.
12. Znane ograniczenia
Ranking jest modelem, a nie wyrocznią. Pięć obszarów, w których sygnał jest słabszy niż reszta systemu — i użytkownicy powinni czytać wyniki z tym zastrzeżeniem.
- Wykrywanie umeblowania jest oparte na zdjęciach. Około 61% lokali ma wykrywalną pojemność łóżek dzięki analizie zdjęć przez LLM. Pozostałe 39% traktujemy jako nieznane, a nie jako nieumeblowane. To najlepszy dostępny sygnał, gdy opis w ogłoszeniu jest niewiarygodny, ale pomija lokale, w których meble nie są widoczne na kadrze.
- Sygnały z recenzji i zaufania są nierówne w zależności od źródła. Airbnb ma liczbę recenzji, odznaki superhost i flagi „guest-favourite”. Argenprop, Zonaprop i MercadoLibre nie. Wyniki zaufania dla źródeł innych niż Airbnb opierają się na wieku ogłoszenia, wolumenie agenta, relacji cena–rynek i opiniach użytkowników — węższy zestaw danych wejściowych.
- Szacowanie expensas ma trzy poziomy awaryjne. Rzeczywiste expensas stosujemy wtedy, gdy ogłoszenie je publikuje. W przeciwnym razie model używa mediany dla innych lokali w tym samym budynku, potem średniej dla barrio na metr kwadratowy, a na końcu procentu czynszu. Każdy kolejny poziom awaryjny jest mniej precyzyjny niż poprzedni. Około 40% bezpośrednich wynajmów korzysta przynajmniej z jednego poziomu awaryjnego.
- Model hałasu pomija orientację wewnętrzną. Lokal od strony dziedzińca jest zwykle o 10–20 dB cichszy niż lokal od strony ulicy w tym samym budynku. Model ma na to pola (
bedroom_faces,faces_street), ale są wyciągane ze zdjęć tylko w 14% przypadków. Dla pozostałych 86% wynik hałasu odzwierciedla ekspozycję na hałas na zewnątrz bez korekty orientacji, więc lokale od strony ulicy wewnątrz cichszych budynków wyglądają lepiej, niż są, a lokale wewnętrzne w hałaśliwych budynkach wyglądają gorzej, niż są. - Hedonic R² ma wartość 0.51. Model ceny wyjaśnia 51% zaobserwowanej zmienności wśród 6,046 ogłoszeń. Pozostałe 49% to szum, niewidoczne cechy oraz osobliwości konkretnego ogłoszenia (stan, historia sporu, motywacja właściciela). Ranking używa regresji hedonicznej do walidacji, a nie do wyceny, więc sufit nie ogranicza końcowego wyniku — ale użytkownicy, którzy wczytują w szacunki cen „R² = 1”, powinni obniżyć oczekiwania.
Każde z tych ograniczeń jest aktywnie zawężane. Surowe dane są publicznie dostępne. Błędy mile widziane: [email protected].
13. Jak cytować te wyniki
Dane Unitrank są udostępniane na licencji Creative Commons Attribution-ShareAlike 4.0. Możesz cytować liczby, osadzać tabele lub ponownie publikować zbiory danych z podaniem autorstwa. Użycie komercyjne jest dozwolone na tych samych warunkach licencji.
Udostępniamy dane, bo wolelibyśmy być cytowani niż ukryci za paywallem. Liczby dotyczące rynku wynajmu w Buenos Aires są warte więcej w obiegu (w dziennikarstwie, pracach nad polityką, badaniach naukowych i narzędziach partnerów) niż zamknięte w jednym miejscu. Standard jest prosty: przypisz źródło, zachowaj pochodne na tej samej licencji.
Proponowana forma cytowania
Unitrank (May 2026). Dane dotyczące rynku wynajmu w Buenos Aires. Uzyskano z unitrank.com/en/methodology. Licencja CC BY-SA 4.0.
Dla dziennikarzy i badaczy
- Jednostka (named entity): Unitrank na Wikidata (Q138792840).
- Dane hurtowe: miesięczne migawki na github.com/unitrank/public-data.
- Zapytania niestandardowe: barrio, długość pobytu lub skład gospodarstwa domowego — dostępne na życzenie.
- Egzemplarze do weryfikacji: checki faktów przed publikacją w ciągu 24 godzin dla prac objętych deadlinem.
- Linia atrybucji: „Source: Unitrank, Buenos Aires rental market data, May 2026”.
Pytania o metodologię: [email protected].