Анализ продаж тг-имён - 2
Первая часть - https://teletype.in/@kotibot/w8IjshhGxQS
Делюсь как есть - без особой системы, "в потоке".
Пока не знаю, как добавить интерактивные графики, когда руки дойдут - переделаю, так интереснее.
Результаты
Приведена описательная статистика, рассмотрены количественные характеристики продаж - длина и "чистота" имени, рассмотрена их связь с ценой
Описательная статистика
min = 4 TON, max = 80000 TON (на графике обрезал)
Длина имен
* 4 символа - 20 имен (16 - 5050 TON) (telegram не дает занять имя в 4 символа)
Всплеск на 17 - это группа дорогих длинных имен:
Связь длины с "чистотой" имени
Высокий процент коротких имен (5, 6) с цифрами
Среди коротких имен из "грязных" преобладают с цифрами,
а среди длинных чаще с "_" (скорее всего "_" выступает разделителем между словами).
"совсем грязные" практически не продаются.
Связь длины с ценой
Пики активности продаж
Выводы
Следующий шаг - анализ морфологии, семантики и тематики проданных имен.
А не являются ли продажи по 10 TON сигналом того, что имя НЕ продано? Во всех случаях или в некоторой части. Надо проанализировать механизм моментальных продаж и аукционов, контрагентов этих сделок, и если возникнет гипотеза, проверить статистически