Як працює Unitrank
Технічна примітка про джерела даних, моделювання та відомі обмеження. Оновлено May 2026.
Unitrank ранжує кожну квартиру за тим, скільки саме вашого життя вона коштує. Не лише орендна плата: час на дорогу, шум, доступ до продуктів, якість робочого простору та кожна інша щоденна активність. Квартира, яка коштує вам найменше хвилин на день, займає перше місце.
Результати персоналізуються під ваше місце роботи, склад домогосподарства, дохід і стиль життя. Оскільки ми агрегуємо дані з усіх основних платформ, алгоритм порівнює Airbnb у Палермо з прямою орендою на Argenprop, тимчасовим оголошенням на Zonaprop і квартирою, яку власник виставив на MercadoLibre, на однакових умовах: та сама модель вартості, той самий розрахунок часу на дорогу, той самий показник шуму.
1. Чому це складніше, ніж здається
Дані про квартири — це не «чистий» датасет. Це ворожий, безперервно деградуючий середовище.
Оголошення «засинають». Ціни змінюються. Фото замінюють, інколи на зображення з старіших одиниць або на постановочні кадри, які не відповідають тому, що ви реально побачите під час перегляду. Та сама квартира трапляється на двох-трьох платформах з різними цінами, різною кількістю спалень і, інколи, з різними координатами. Категорії використовують доволі вільно: «1 bedroom», «студія», «temporary», «furnished» та «dueño directo» означають різні речі на різних джерелах, а інколи — різні речі навіть в межах одного й того ж джерела. Комісії, витрати на будинок, припущення щодо комунальних послуг та вартість гарантії часто приховані, пом’якшені або згадуються лише після першого контакту.
Навіть базові порівняння руйнуються без корекцій. Оголошення, яке виглядає дешевим, може виявитися дорожчим за сусіднє, щойно ви додасте назад витрати на будинок, комунальні послуги, амортизовану гарантію та комісію брокера. Оголошення, яке на папері виглядає подібним, у реальності може означати дуже різну квартиру, будівлю або умови проживання.
Ось чому пошук квартири — це не «проблема бази даних». Це безперервний процес інгесту, дедуплікації, нормалізації, витягування відсутніх атрибутів, валідації та корекції щодо ринку, який одночасно шумний, стратегічний і активно змінюється під даними.
2. Чому вподобання — не буквальні фільтри
Стандартні портали сприймають вподобання як чисті бінарні фільтри. Реальний намір орендаря — значно складніший.
Коли хтось каже «бюджет $1,200», це може означати максимальну заявлену орендну плату, максимальну фактичну «все-в-одному» вартість, комфортну ціль, яка «плаває», якщо квартира явно краща, або число, яке змінюється разом із покращенням часу на дорогу чи комплектації меблями. Коли хтось каже «близько до роботи», це може означати пішу доступність, коротку поїздку на метро або просто «не виснажує до кінця тижня». «З меблями» коливається від «готово заїхати одразу» до «є ліжко». «Безпечно» може означати низьку злочинність, тихіші вулиці, краще утримання або просто район, який відчувається спокійнішим.
Двоє орендарів можуть дати ідентичні вхідні дані й отримати абсолютно різні результати. Дві однакові квартири можуть бути правильним вибором для однієї сім’ї та неправильним — для іншої. Причина в тому, що вподобання — це стислі вираження компромісів (час проти грошей, зручність проти ціни, якість проти тертя), і ці компроміси не вловлюються простим збігом «мітки».
Тому Unitrank трактує багато вподобань як інтерпретовані сигнали. Ранжування оцінює компроміси саме для вашого домогосподарства, тривалості проживання, доходу та стилю життя — а не лише для слів, які ви ввели у фільтр.
3. Що ми вимірюємо
Кожну квартиру оцінюють за 21 життєвими сценаріями. Кожен із них — це щоденна або щотижнева активність, яку ваша квартира робить легшою або важчою.
| Категорія | Сценарії | Що це відображає |
|---|---|---|
| Умови для життя | Житло, Сон, Гігієна, Зберігання | Оренда, якість ліжка, доступ до ванної, місце для зберігання |
| Продуктивність | Фокус, Прибирання, Прання | Якість робочого простору, час на підтримку домогосподарства |
| Фітнес | Кардіо, Сила | Доступ до залу, близькість парку, зручності будівлі |
| Їжа | Трапези, Продукти | Якість кухні, близькість супермаркету, варіанти ресторанів |
| Соціальне життя | Нетворкінг, Дейтинг, Розваги | Коворкінг, ресторани, доступ до нічного життя |
| Сім’я | Дитячий догляд, Школа, Піклування про собаку | Автоматичне активування залежно від складу домогосподарства |
| Добробут | Задоволеність | Психологічний комфорт, масштабований за доходом |
Жоден сценарій не домінує в ранжуванні. Перемагає та квартира, де всі 21 сценарії разом коштують найдешевше.
Для кожного сценарію змагаються кілька стратегій. Квартира з басейном може «пропустити» дорогу до залу для кардіо. Без робочого столу враховується вартість коворкінгу. Готуєте вдома, їсте поза домом чи замовляєте доставку: усі три варіанти змагаються для кожної трапези, і перемагає найдешевший.
Для сценаріїв із кількома близькими варіантами поїздки розподіляються між конкуруючими локаціями з урахуванням відстані та якості. Ближчий супермаркет із кращим асортиментом «забирає» більше ваших поїздок за продуктами, ніж далекий магазин біля дому. Сніданок, обід і вечеря моделюються окремо з різними вподобаннями до локацій та масштабуванням під домогосподарство.
4. Що алгоритм виявляє
Чотири рішення, які ранжування приймає інакше, ніж людина, що переглядає оголошення.
Шум у межах однієї будівлі
Квартира, що виходить на вулицю, і квартира, що виходить на внутрішній дворик, за тією самою адресою можуть відрізнятися на 15–20 dB. Це різниця між сном із берушами та сном у тиші. Обидві квартири вказують однакову орендну плату. Жодна платформа не розрізняє ці варіанти. Ранжування знає, з якого боку будівлі вихід на авеню.
Трикутник дороги
Орендар, який працює в Мікросентро, тренується в Бельграно, а діти навчаються в Нúñез, має три поїздки — не одну. «Палермо центральне» загалом правда, але для цього домогосподарства — хибно. Ранжування знаходить квартиру, яка мінімізує трикутник із усіх трьох пунктів призначення. Обираючи Палермо лише тому, що всі кажуть «Палермо коштує +20–40 додаткових хвилин на день», ви платите часом.
Експенси — «сюрприз»
Дві квартири з орендою $800/міс. Одна має $50/міс у витратах на будівлю, інша — $250. Квартира за $800+$250 дорожча за квартиру за $900 із $80 витратами на будівлю. Орендарі фільтрують за орендою. Ранжування сортує за «все-в-одному» вартістю.
З меблями проти без меблів: справжнє порівняння
Більшість платформ позначають квартири як «з меблями» або «без меблів», але ніколи не порівнюють їх на рівних умовах. Ранжування — так. Воно рахує справжню вартість квартири без меблів, включно з купівлею меблів, доставкою, складанням і утилізацією під час виїзду. Для проживання до 12 місяців квартири без меблів часто коштують дорожче за мебльовані, щойно врахуєте ці приховані витрати. Кожен користувач бачить порівняння, прив’язане до тривалості проживання, яку він планує.
5. Розрахунок «все-в-одному»
Більшість платформ показують базову орендну плату. Ми показуємо, що ви реально платите щомісяця.
| Компонент | Як ми це рахуємо |
|---|---|
| Базова оренда | Місячна орендна плата, як вказано. Для Airbnb: нічна ставка × 30 + плата за прибирання + сервісна плата |
| Експенси | Витрати на будівлю. Фактичні, якщо вказані в оголошенні; інакше оцінка з оголошень сусідніх квартир або середніх значень по барріо |
| Комунальні послуги | Оцінка з площі квартири та кількості кондиціонерів. На основі тарифів без субсидій від Edenor, Metrogas і AySA |
| Гарантія оренди | Seguro de caución амортизується щомісяця: ~8% від загальної вартості контракту, поділені на кількість місяців контракту. Нуль для тимчасової оренди та для варіантів «власник напряму» |
| Комісія брокера | Амортизується щомісяця. Залежить від оголошення: дехто бере 1–2 місяці, дехто — нуль. У «власник напряму» оголошення немає комісії брокера |
6. Модель дороги
Пішохідні та автомобільні відстані використовують реальне маршрутування на основі дорожніх даних OpenStreetMap. Це справжні пішохідні маршрути, а не «відстань по прямій».
| Спосіб | Метод | Параметри |
|---|---|---|
| Пішки | Маршрутизація OSRM (маршрутизатор із відкритим кодом) | 82 м/хв, 5.0 км/год |
| Їзда на авто | Автомобільна маршрутизація OSRM | Включає час на паркування та вартість пального |
| Subte | Транзитні розклади GTFS + доступ пішки до станції | Йти до станції + 5 хв очікування + проїзд + штраф за пересадку + піша частина до пункту призначення |
| Colectivo | Частоти GTFS | Йти до зупинки + 8 хв очікування + поїздка зі швидкістю 14 км/год |
| Поїзд | Розклади GTFS | Йти до станції + 10 хв очікування + проїзд зі швидкістю 27 км/год «усі зупинки» |
Відстані попередньо обчислюються для 265 категорій і 245k+ точок інтересу: супермаркетів, станцій subte, парків, залів, шкіл, коворкінгів тощо. Для кастомних локацій на кшталт адреси роботи чи школи точні маршрути обчислюються під час запиту.
7. Модель шуму
Кожній квартирі присвоюють показник впливу шуму від 0 (тихо) до 100 (значний рівень впливу).
Зовнішній шум: 5 джерел
- Дорожній трафік: модель шуму CoRTN для доріг на базі геометрії доріг OpenStreetMap з каліброваними обсягами трафіку. Основні дороги дають найбільший внесок.
- Авіація: послаблення точкового джерела з Aeroparque. Впливає в першу чергу на Палермо, Бельграно та Нúñез.
- Нічне життя: нічні клуби та бари в радіусі 200 м. Актуально для Палермо-Сохо, Сан-Тельмо та районів розваг.
- Зупинки автобуса: зупинки colectivo на маршрутах із високою частотою вздовж великих авеню.
- Разом: усі 5 джерел підсумовуються в домені потужності через акустичне додавання.
Послаблення всередині приміщення
Зовнішній шум зменшується «оболонкою» будівлі. Закриті вікна з кондиціонером знижують рівень на 14 dB. Відкриті вікна без кондиціонера знижують на 10 dB. Вік будівлі додає 0–3 dB, двокамерні вікна додають 5 dB, а звукоізоляція додає 3 dB. Значення для відкритих вікон — з Locher et al. 2018, дослідження 102 швейцарських помешкань.
Оцінювання впливу
Формула: (indoor_dB - 35) / 30 × 100, значення обмежуються в межах 0–100. Базова точка 35 dB розміщена між рекомендацією ВООЗ щодо сну 30 dB та офісним стандартом ASHRAE 35 dB. Потолок 65 dB — це поріг ВООЗ «значної суспільної проблеми для здоров’я».
8. Перетворення грошей на час
Усі витрати переводяться у хвилини на день за формулою, що враховує і здатність заробляти, і психологічну «вагу» витрат:
minutes_per_dollar = √(labor_rate × perception_rate)
| Річний дохід | Хвилини на $1/день | Інтерпретація |
|---|---|---|
| $20,000 | 7.21 | Кожен долар щоденних витрат відчувається як 7 хвилин вашого життя |
| $60,000 | 3.16 | Точка відліку |
| $100,000 | 2.19 | Гроші важать менше, час важить більше |
| $200,000 | 1.28 | Оптимізація за часом, а не за вартістю |
9. Статистична валідація
Ми валідуємо нашу модель вартості за ринковими цінами через гедоністичну регресію — статистичний метод, який відокремлює премію до ціни для кожної окремої характеристики.
- Метод: напівлогарифмічна регресія з фіксованими ефектами гексагональної сітки, з контролем локації на рівні кварталу (~460 м роздільність)
- Характеристики: 60+ зручностей тестуються одночасно: басейн, паркування, пральна машина, ліфт, кондиціонер, робочий простір, посудомийна машина та інше
- R²: 0.51, тобто 51% варіації ціни пояснюється моделлю. Узгоджується з опублікованими гедоністичними дослідженнями
- Спостереження: 6,046 оголошень із повними даними
Там, де наша модель узгоджується з ринковими цінами, у нас є підтвердження. Там, де ми не погоджуємося, алгоритм знаходить цінність, яку інші пропускають.
| Характеристика | Наша «пеня» | Ринкова премія | Що це означає |
|---|---|---|---|
| Посудомийна машина | 8 хв/день | 5.7% | Підтверджено: модель і ринок збігаються |
| Басейн | 5 хв/день | 18.9% | Ринок завищує: можливо, ви платите за басейн, яким рідко користуєтеся |
| Якість робочого простору | 25–75 хв/день | ~0% | Сліпа зона ринку: коли ви працюєте з дому, алгоритм знаходить недооцінені квартири з хорошими офісами |
| Шум (дворик проти вулиці) | 5–15 хв/день | Частково оцінено | Вибір квартири в межах однієї будівлі — це чистий арбітраж: та сама будівля, інший рівень шуму, та сама ціна |
| Близькість до собачого парку | 4 хв/день за кожну хвилину відстані | Не оцінюється | Коли у вас собака, 14 прогулянок на тиждень роблять близькість цінною. Ринок це ігнорує |
Кожна можливість арбітражу персоналізується. Перевага робочого простору з’являється лише коли ви вказуєте, що працюєте віддалено. Перевага собачого парку з’являється лише коли ви вказуєте, що у вас є собака. Алгоритм адаптується до вашого життя, а не до середніх уподобань ринку.
10. Джерела даних
| Джерело | Що ми використовуємо | Обсяг | Оновлення |
|---|---|---|---|
| Airbnb | Оголошення, ціноутворення, відгуки, фото | 29,291 | Ротація пошуку; деталі щодо тригерів актуальності |
| Argenprop | Оголошення, ціни, фото | 23,963 | Ротація з урахуванням «ваги» рівня; спочатку барріос категорії A |
| Zonaprop | Оголошення, ціни, фото | 25,372 | Безперервне виявлення; повне сканування в ротації |
| MercadoLibre | Оголошення, ціни, фото | 34,792 | Найсильніший інвентар прямих оголошень серед порталів |
| OpenStreetMap | ТОПи по 265 категоріях | 245k+ | Періодичне оновлення витягу |
| OSRM | Маршрути пішки та авто | 41,921,692 відстаней | Самостійно розміщено; перерахунок при змінах POI |
| GTFS | Транзитні розклади: subte, colectivo, поїзд | 16k+ станцій | Періодичне оновлення розкладів |
| LLM enrichment | Аналіз фото: зручності, стан, площа | ~460 фактів/одиницю | Безперервні партії; розподіл на premium/economy |
| dolarapi.com | Курс USD/ARS | — | У режимі реального часу |
Нові джерела додаються регулярно. Кожна нова платформа підвищує охоплення та зміцнює порівняння між платформами.
11. Частота оновлень
Актуальність даних напряму впливає на якість ранжування. Застарілі оголошення марнують ваш час.
- Сканування пошуку: Безперервно для кожного джерела. Найновіше-перше виявлення плюс ротаційні повні перегляди. Нові оголошення зазвичай з’являються протягом кількох годин після публікації.
- Перевірка доступності: синхронізація календаря та повторне завантаження деталей при сигналах застарілості або якщо оголошення «випало» з пошуку. Якщо доступність порожня, оголошення прибирається з ранжування.
- Пріоритезація з урахуванням «рівнів»: барріос категорії A (Palermo, Recoleta, Belgrano, Núñez, Vicente López та подібні) оновлюються раніше за барріос категорій B і C.
- LLM enrichment: безперервна пакетна обробка з розподілом на premium/economy. Нові оголошення зазвичай збагачуються протягом кількох годин після виявлення.
- Перебудова ранжування: інкрементальні оновлення при кожній зміні оголошення. Повна перебудова щоночі.
- Скоринги довіри: оновлюються за відгуками користувачів, «віком» оголошення та сигналами верифікації.
- Обчислення ранжування: персоналізовані результати менш ніж за 28 мс (p95), зазвичай 26 мс (p50). Оцінює всі 21 життєвих сценарії для всього інвентарю, обирає оптимальну стратегію для кожного сценарію в межах одиниці та показує кожне рішення з повним розкладом витрат. Обчислюється для кожного запиту, а не кешується наперед.
12. Відомі обмеження
Ранжування — це модель, а не «оракул». П’ять зон, де сигнал слабший, ніж у решти системи, і де користувачам варто читати результати з урахуванням цього.
- Виявлення меблів — на основі фото. Приблизно 61% одиниць має вимірювану місткість спальних місць із аналізу фото LLM. Решта 39% трактуються як невідомі, а не як «без меблів». Це найкращий доступний сигнал, коли текст оголошення ненадійний, але він пропускає одиниці, у яких меблі «в кадр не потрапили».
- Сигнали з відгуків і довіри неоднорідні між джерелами. Airbnb має кількість відгуків, бейджі суперголосподарів і позначки «улюблене гостей». Argenprop, Zonaprop і MercadoLibre — ні. Скоринги довіри для не-Airbnb джерел повертаються до «віку» оголошення, обсягу агента, ціни відносно ринку та відгуків користувачів — тобто до вужчого набору вхідних даних.
- Оцінка експенси має три рівні «підстраховок». Фактичні експенси використовуються, коли оголошення їх публікує. Інакше модель бере медіану для інших одиниць у цій самій будівлі, потім середнє по барріо за квадратний метр, потім відсоток від оренди. Кожна наступна підстраховка менш точна, ніж попередня. Приблизно 40% прямих орендних оголошень переходять хоча б на один рівень підстраховок.
- Модель шуму не враховує орієнтацію вікон усередині. Квартира, що виходить на дворик, зазвичай на 10–20 dB тихіша, ніж квартира, що виходить на вулицю в тій самій будівлі. У моделі є поля для цього (
bedroom_faces,faces_street), але їх витягують із фото лише за 14% охоплення. Для інших 86% скор «шум» відображає зовнішній вплив без поправки на орієнтацію, тож квартири з виходом на вулицю всередині тихіших будівель виглядають кращими, ніж вони є, а внутрішні квартири в шумних будівлях — гіршими, ніж вони є. - Гедоністичний R² дорівнює 0.51. Модель ціни пояснює 51% спостереженої варіації по 6,046 оголошеннях. Інші 49% — це шум, невиміряні характеристики та особливості конкретних оголошень (стан, історія спорів, мотивація власника). Ранжування використовує гедоністичну регресію для валідації, а не для ціноутворення, тож «потолок» не обмежує фінальний бал — але користувачам, які читають «R² = 1» у прогнозах цін, варто стримати очікування.
Кожне з цих обмежень активно звужується. Сирі дані відкриті. Помилки вітаються: [email protected].
13. Як цитувати цю роботу
Дані Unitrank опубліковані за ліцензією Creative Commons Attribution-ShareAlike 4.0. Ви можете цитувати цифри, вбудовувати таблиці або перевидавати датасети з вказанням авторства. Комерційне використання дозволене на тих самих умовах ліцензії.
Ми публікуємо дані, тому що нам краще бути процитованими, ніж схованими за paywall. Цифри ринку оренди Буенос-Айреса коштують більше в обігу (у журналістиці, роботі над політиками, академічних дослідженнях і інструментах партнерів), ніж у закритому доступі. Стандарт простий: вкажіть джерело, а похідні матеріали тримайте під тією самою ліцензією.
Рекомендована цитата
Unitrank (May 2026). Дані ринку оренди Буенос-Айреса. Отримано з unitrank.com/en/methodology. Ліцензія CC BY-SA 4.0.
Для журналістів і дослідників
- Іменована сутність: Unitrank на Wikidata (Q138792840).
- Масові дані: щомісячні знімки на github.com/unitrank/public-data.
- Кастомні запити: барріо, тривалість проживання або склад домогосподарства — доступні на запит.
- Перевірки для публікації: fact checks до публікації протягом 24 годин для робіт із дедлайном.
- Рядок атрибуції: "Source: Unitrank, Buenos Aires rental market data, May 2026".
Питання про методологію: [email protected].