January 10, 2018

u_o_i @ 2018-01-10T22:55:00

Дані гугля про відношення кількості запитів укр. мовою до таких же, але рос. мовою по пошуку обл. центру.
Тобто, напр. наскільки частіше шукали Львів від  Львова  у Львівській обл., і тд.

2013 2014 2015 2016 2017 Тернопіль 11,11 10,00 12,50 14,29 25,00 Франківськ 7,69 8,33 11,11 12,50 14,29 Львів 6,25 6,67 7,14 7,69 9,09 Луцьк 3,57 3,70 5,00 5,56 7,14 Рівне 1,92 2,17 2,70 3,57 4,55 Чернівці 1,09 1,27 1,39 1,56 1,96 Ужгород 1,11 1,49 1,67 1,64 1,54 Хмельницький 0,66 0,81 0,91 1,02 1,37 Вінниця 0,28 0,33 0,39 0,49 0,62 Черкаси 0,20 0,24 0,27 0,33 0,39 Житомир 0,14 0,18 0,20 0,25 0,27 суми 0,08 0,09 0,10 0,10 0,13 кропивницький 0,07 0,07 0,07 0,07 0,12 полтава 0,06 0,06 0,07 0,07 0,08 київ 0,04 0,04 0,05 0,06 0,07 чернігів 0,04 0,04 0,05 0,05 0,05 одеса 0,01 0,01 0,02 0,02 0,02 миколаїв 0,01 0,02 0,02 0,02 0,02 херсон 0,01 0,01 0,01 0,01 0,01 дніпро 0,01 0,01 0,01 0,01 0,01 запоріжжя 0,01 0,01 0,01 0,01 0,01 Харків 0,01 0,01 0,01 0,01 0,01 Цікаво, що кількість укр. мовою зросла по всіх областях, крім югавастока і крайнього Заходу (Ужгород).
Ще цікавіше, що, якщо порівнювати запити з минулих років, то вони також змінилися .
 Крім таблички,  кілька графіків
Графік зміни відношення к-сті запитів у містах, де переважають запити українською.

Графік зміни відношення к-сті запитів у містах, де переважають запити російською (крім югавастока, де українська  в межах стат. похибки).

Міста з максимальною вибіркою укр. мовою (за 2017 рік)
Цікаво, що на 2-му місці Київ незважаючи на те , що Киев шукають частіше від Києва в 14 разів

Українські міста з максимальною вибіркою. Серед них тільки одне українською- Львів - на 4-му місці.

до цієї ж таблиці - по областях, де яке місто найчастіше шукають

Якщо Харків, Дніпро і Одеса є лідерами тільки в своїх областях, то Львів - у всіх трьох галицьких.

Upd/

Декому здається , що краще і інформатифніше було б, якщо б була представлена загальна статистика запитів на обох мовах . Звичайно, що "загальний перепис" ліпше від "соціологічного дослідження" . Але є кілька "але".

По - перше, тра брати до уваги досить велику кількість спільних слів в українській і російській мовах, а якщо врахувати і етимологічний характер російського правопису, де слова, які російською звучать інакше , ані ж українською,  на письмі відображаються одинаково, то тра буде все- одно шукати якийсь маркер - чи це мова російська, чи українська.

По- друге, якщо тра буде шукати ці маркери, то вартувало б саме цими маркерами і обмежитися. Але тут тра врахувати  безліч моментів, наприклад - синонімічний ряд слова в російській і українській мовах, і , відповідно , частота вживання слова і його синонімічних відповідників, які не можуть слугувати маркерами, бо на письмі передаються одинаково українською і російською, чи в свою чергу є синонімами інших слів (напр. українське "і" з синонімами "й, та, а" vs російське "и" з синонімами "да" ,"а (также)" , де "да" і "а" виступає також синонімами інших слів).

По - третє - при виборі маркера тра враховувати, що при пошуку людина користується тією мовою, якою їй зручніше у випадку, якщо обсяг інформації, яку вона сподівається отримати, є одинаковий і російською, і українською мовами.

Нагадаю, що в  цьому дослідженні ставилась мета визначити, яка мова є мовою по - дефолту в обласних центрах (тобто, якою мовою є мова спілкування з незнайомими людьми). Звичайно, що незважаючи на особисті мовні преференції,

людина буде при звертанні робити відповідну кореляцію, щоб її зрозуміли, не крутили носом і тд. Для цього тра було підібрати маркери , які найкраще на даній території моделювали б таку ситуацію. На жаль, спільного для усіх територій маркеру підібрати не вдалося . Слово "Україна" vs "Украина"  по всій території держави шукається частіше російською, що, власне , і показує, "кто в домє хазяін" єдіной страни. Відповідно, назва обласного центру відображає це ж саме, але в межах відповідної області - тому вважаю, що цей метод найкращий з тих, що мною розглядалися.

Якщо ж задатися ціллю, якій мові надають преференцію при одинаковому результаті пошуку на обох мовах, без "тиску середовища" то вартувало б у якості маркера використати словосполучення "погода + місто" - але це вже хіба наступного разу.