<?xml version="1.0" encoding="utf-8" ?><rss version="2.0" xmlns:tt="http://teletype.in/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:media="http://search.yahoo.com/mrss/"><channel><title>Дарья Плотская</title><generator>teletype.in</generator><description><![CDATA[Дарья Плотская]]></description><image><url>https://img3.teletype.in/files/a6/e6/a6e6cca3-d1a7-4bc1-927c-510231037773.png</url><title>Дарья Плотская</title><link>https://teletype.in/@olticher</link></image><link>https://teletype.in/@olticher?utm_source=teletype&amp;utm_medium=feed_rss&amp;utm_campaign=olticher</link><atom:link rel="self" type="application/rss+xml" href="https://teletype.in/rss/olticher?offset=0"></atom:link><atom:link rel="next" type="application/rss+xml" href="https://teletype.in/rss/olticher?offset=10"></atom:link><atom:link rel="search" type="application/opensearchdescription+xml" title="Teletype" href="https://teletype.in/opensearch.xml"></atom:link><pubDate>Fri, 17 Apr 2026 19:27:22 GMT</pubDate><lastBuildDate>Fri, 17 Apr 2026 19:27:22 GMT</lastBuildDate><item><guid isPermaLink="true">https://teletype.in/@olticher/pitchfork</guid><link>https://teletype.in/@olticher/pitchfork?utm_source=teletype&amp;utm_medium=feed_rss&amp;utm_campaign=olticher</link><comments>https://teletype.in/@olticher/pitchfork?utm_source=teletype&amp;utm_medium=feed_rss&amp;utm_campaign=olticher#comments</comments><dc:creator>olticher</dc:creator><title>Анализ рецензий с сайта pitchfork.com</title><pubDate>Sun, 29 May 2022 18:41:17 GMT</pubDate><media:content medium="image" url="https://img2.teletype.in/files/95/33/9533f6e7-3e13-4fe5-a329-0c9917c4b089.png"></media:content><description><![CDATA[<img src="https://img4.teletype.in/files/b1/c7/b1c7fa4d-72c4-49da-bd2c-1674ec2bbb42.png"></img>Я учусь на аналитика данных. В целом, это достаточно занимательная сфера деятельности, поскольку есть возможность проанализировать практически все доступные тебе данные. Недавно мы с моим одногруппником провели небольшое исследование по математической лингвистике, основанное на рецензиях с сайта https://pitchfork.com/ c 1999 по январь 2017. Данные брали с сайта kaggle.com (https://www.kaggle.com/datasets/nolanbconaway/pitchfork-data). Результаты получились довольно занимательными. ]]></description><content:encoded><![CDATA[
  <p id="q12H">Я учусь на аналитика данных. В целом, это достаточно занимательная сфера деятельности, поскольку есть возможность проанализировать практически все доступные тебе данные. Недавно мы с моим одногруппником провели небольшое исследование по математической лингвистике, основанное на рецензиях с сайта https://pitchfork.com/ c 1999 по январь 2017. Данные брали с сайта kaggle.com (<a href="https://www.kaggle.com/datasets/nolanbconaway/pitchfork-data" target="_blank">https://www.kaggle.com/datasets/nolanbconaway/pitchfork-data</a>). Результаты получились довольно занимательными. </p>
  <p id="Dvds">Сначала давайте посмотрим на график распределения оценок всех рецензий</p>
  <figure id="nyS5" class="m_column">
    <img src="https://img4.teletype.in/files/b1/c7/b1c7fa4d-72c4-49da-bd2c-1674ec2bbb42.png" width="395" />
  </figure>
  <p id="amhv">В целом видно, что авторы питчфорка часто ставят оценки от 6 и выше. Больше всего наблюдаем оценку 8. А еще замечаем, что есть пара ревью с нулевым скором. Посмотрим на них более детально:</p>
  <figure id="jzwk" class="m_column">
    <img src="https://img1.teletype.in/files/8c/01/8c01a23d-332d-4600-95a2-a5407d82530e.jpeg" width="1365" />
  </figure>
  <p id="L0os">Таких рецензий 5. Кому интересно, вот ссылки для ознакомления с дном музыки по мнению авторов питчфорка:</p>
  <ol id="lCsk">
    <li id="DeAh"><strong>Various Artists - This Is Next <a href="https://pitchfork.com/reviews/albums/10571-this-is-next/Robert" target="_blank">https://pitchfork.com/reviews/albums/10571-this-is-next/Robert</a> </strong></li>
    <li id="LZPA"><strong>Pollard - Relaxation of the Asshole <a href="https://pitchfork.com/reviews/albums/6383-relaxation-of-the-asshole/Travis" target="_blank">https://pitchfork.com/reviews/albums/6383-relaxation-of-the-asshole/</a></strong></li>
    <li id="FGTX"><strong>Travis Morrison - Travistan <a href="https://pitchfork.com/reviews/albums/5607-travistan/Liz" target="_blank">https://pitchfork.com/reviews/albums/5607-travistan/</a></strong></li>
    <li id="X4G8"><strong>Liz Phair - Liz Phair <a href="https://pitchfork.com/reviews/albums/6255-liz-phair/Sonic" target="_blank">https://pitchfork.com/reviews/albums/6255-liz-phair/</a></strong></li>
    <li id="aSTB"><strong>Sonic Youth - NYC Ghosts &amp; Flowers <a href="https://pitchfork.com/reviews/albums/7342-nyc-ghosts-flowers/" target="_blank">https://pitchfork.com/reviews/albums/7342-nyc-ghosts-flowers/</a></strong></li>
  </ol>
  <p id="fNle">Релизов с оценкой 10/10 - 76:</p>
  <figure id="1QZy" class="m_column">
    <img src="https://img3.teletype.in/files/a2/6f/a26fcf6a-1a17-4dfd-8aa2-886f215b7c7e.jpeg" width="1222" />
  </figure>
  <p id="dMr2">Сразу видим Брайана Ино, Стиви Вандера и Нину Симон.</p>
  <figure id="zvt5" class="m_column">
    <img src="https://img2.teletype.in/files/9d/ea/9dea62db-3d3e-4fec-b871-5f126e7f5503.jpeg" width="746" />
  </figure>
  <p id="sfEJ">Процентное соотношение рецензий:</p>
  <ul id="Kdsv">
    <li id="wgOH">С оценкой 7 и выше - 56.1%</li>
    <li id="dnNk">С оценкой ниже 7 - 43.9%</li>
  </ul>
  <p id="2V2H">Далее с помощью векторизации и логистической регрессии мы получили датасет, который состоит из двух столбцов: в первом находятся отдельно взятые слова из рецензий, а во втором - вес данного слова, или его коэффициент. Каждый коэффициент означает, <strong>насколько сильно наличие данного слова в обзоре влияет на то, будет обзор положительным или отрицательным </strong>(в рамках данного исследования мы считали ревью положительным, если оценка 7 и выше, а отрицательным - ниже 7). Грубо говоря, получившаяся таблица говорит о том, насколько в high-score или low-score обзоре то или иное слово встречается чаще. Если у слова вес больше 0, то его вероятнее встретить в положительных ревью, и наоборот - если меньше 0, то в отрицательных. </p>
  <p id="hOdE">При рассмотрении результатов стоит учитывать несколько моментов:</p>
  <ul id="6RwF">
    <li id="CskH">Некоторые слова являются омонимами. Например, “west” может означать как сторону света, так и Канье Уеста, а “twin” - близнеца и Афекса Твина. Такое происходит из-за того, что в процессе формирования результатов регистр не учитывался и автоматически приводился к нижнему.</li>
    <li id="RsXw">Мы намеренно убрали из датасета так называемые “стоп-слова”. Это предлоги, союзы, местоимения, артикли и т.д. В общем, все то, что не несёт смысловой нагрузки.</li>
    <li id="O6xR">В таблице скорее всего нет имен исполнителей, которые стали известными в 2017 году и позже (напоминаю, что изначальный набор данных состоит из ревью с 1999 по январь 2017). Исключение - если артист был на фите с кем-то до этого, либо упоминался в рецензиях на другие релизы.</li>
    <li id="hYaZ">Нельзя точно посмотреть по полному названию группы или имени артиста, в каких они ревью встречаются, если их названия/имена состоят из 2х и более слов. Датасет может сориентировать вас только по одному слову. </li>
  </ul>
  <figure id="nToX" class="m_original">
    <img src="https://img3.teletype.in/files/ed/95/ed953d20-6041-4156-9c0e-4f73e5197701.jpeg" width="531" />
  </figure>
  <p id="1ZrL">Я выписала самые интересные слова <strong>с наибольшим положительным коэффициентом:</strong></p>
  <ul id="aXLc">
    <li id="wOEB">reissue</li>
    <li id="4x6M">jazz</li>
    <li id="HQFj">techno</li>
    <li id="2tVC">guitar</li>
    <li id="GfIV">classic</li>
    <li id="mUTy">noise</li>
    <li id="JROP">bass</li>
    <li id="CAyc">black</li>
    <li id="sdFP">violin</li>
    <li id="9Aus">beatles</li>
    <li id="v2rn">vinyl</li>
    <li id="NeZZ">american</li>
    <li id="Mu6x">rhythmic</li>
    <li id="YZyC">funk</li>
    <li id="zpdv">punk</li>
    <li id="fub8">England</li>
  </ul>
  <p id="LRYq">На питчфорке котируют джаз, техно (???), черную музыку, Битлов, американскую и британскую музыку. <em>Небольшая ремарка:</em> в начале списка также было много прилагательных и наречий, с помощью которых обычно восторженно описывают что-либо. Например, <strong>perfect, impressive, excellent, beautiful, remarkable, </strong>etc.</p>
  <p id="yi37">Окей, а что со словами, которые<strong> в конце датасета</strong>?</p>
  <ul id="yend">
    <li id="b8pg">predictable</li>
    <li id="msQv">awkward</li>
    <li id="pVey">disappointing</li>
    <li id="47sB">promising</li>
    <li id="iHDx">worst</li>
    <li id="PMxE">attempt</li>
    <li id="Jwoc">lack</li>
    <li id="3zsr">nice</li>
    <li id="lG3M">pleasant</li>
    <li id="1eq8">better</li>
    <li id="zUHk">sad</li>
    <li id="I9dL">interesting</li>
    <li id="u6uR">little</li>
    <li id="BjNm">worse</li>
    <li id="JkK2">decent</li>
    <li id="ifMQ">unfortunately</li>
  </ul>
  <p id="iuLC">Очевидно, что мы встретили кучу прилагательных и наречий с негативной коннотацией. Посмеялась со слов “interesting” и “nice”. Поняла, что иногда отвечаю людям также о вещах, которые им нравятся, а мне нет)))</p>
  <p id="5LEh">А теперь самая интересная часть. Давайте посмотрим, в каких ревью чаще всего встречаются те или иные исполнители. Я рандомно искала артистов, которых вспоминала в моменте написания кода. </p>
  <figure id="EKoP" class="m_column">
    <img src="https://img3.teletype.in/files/6c/3c/6c3c3718-0732-4d85-9009-30a61c9b5c92.png" width="512" />
    <figcaption>Aphex Twin - средняя оценка 7 и выше</figcaption>
  </figure>
  <p id="IOy2"></p>
  <figure id="Yrm4" class="m_original">
    <img src="https://img2.teletype.in/files/58/d4/58d441ec-d8ab-46e4-9dba-ed5057fab79d.png" width="512" />
    <figcaption>Kanye West с оценками выше, чем у Афекса</figcaption>
  </figure>
  <p id="OKuP">   </p>
  <figure id="CFfp" class="m_original">
    <img src="https://img1.teletype.in/files/cc/7e/cc7e199c-7dc1-46fd-a6c0-5244284c3232.png" width="512" />
    <figcaption>Далее идет Кендрик</figcaption>
  </figure>
  <p id="ITif">  </p>
  <figure id="PbFq" class="m_original">
    <img src="https://img4.teletype.in/files/75/4a/754a8342-45b3-4b23-8060-a5f9b3da48a7.png" width="512" />
    <figcaption>Мой любимый Nicolas Jaar</figcaption>
  </figure>
  <p id="mCjP">  </p>
  <figure id="d4AC" class="m_original">
    <img src="https://img2.teletype.in/files/10/4a/104afada-a486-4268-99ab-041e5c6e60d0.png" width="512" />
    <figcaption>Little Simz еще выше!</figcaption>
  </figure>
  <p id="ghQQ">  </p>
  <p id="dwje">Теперь посмотрим на артистов, наиболее часто упомянутых <strong>в негативных обзорах:</strong></p>
  <figure id="aucS" class="m_original">
    <img src="https://img3.teletype.in/files/ad/fc/adfc2cb3-6a36-4650-b193-7c9ac906cb44.png" width="512" />
    <figcaption>Искренне удивилась, увидев результат по Radiohead. И это учитывая то, что за альбом &quot;Kid A&quot; у них стоит 10/10</figcaption>
  </figure>
  <p id="QOZP">  </p>
  <figure id="RVzj" class="m_original">
    <img src="https://img1.teletype.in/files/cf/da/cfdad306-7478-4d5a-b0bc-819fe950c897.png" width="512" />
    <figcaption>Сольное творчество Тома Йорка в рейтинге идет повыше</figcaption>
  </figure>
  <p id="tlwy">  </p>
  <figure id="xwYs" class="m_original">
    <img src="https://img4.teletype.in/files/73/3c/733c35c0-21fa-4c23-92e0-f092beeb4611.png" width="512" />
    <figcaption>Удивительно, но мой горячо обожаемый Джон Фрушанте тоже достаточно низко. Хотя здесь стоит отметить, что он скорее всего часто упоминался в ревью на RHCP</figcaption>
  </figure>
  <p id="yOuc">  </p>
  <figure id="LH63" class="m_original">
    <img src="https://img3.teletype.in/files/68/e1/68e12a4c-6d0d-4377-8cb0-b52cf885d972.png" width="512" />
    <figcaption>Здесь абсолютно не удивлена</figcaption>
  </figure>
  <p id="eMcy">  </p>
  <figure id="2NUn" class="m_original">
    <img src="https://img2.teletype.in/files/d6/60/d6606bef-b113-4ec3-81e0-9c4a7f153ce5.png" width="512" />
    <figcaption>Ну и финальное: Coldplay!</figcaption>
  </figure>
  <p id="9S03">  </p>
  <p id="8Z2V">Вы можете сами поиграться с поиском слов. Для этого, вам потребуется скачать файл weights.csv из гугл диска и через ctrl+F ввести желаемое слово. </p>
  <p id="r5Bh">Ссылка на гугл диск: <a href="https://drive.google.com/drive/folders/16EVcq0yktyGSGCNEiHfL-yqgZX6vZ8Pw" target="_blank">https://drive.google.com/drive/folders/16EVcq0yktyGSGCNEiHfL-yqgZX6vZ8Pw</a> </p>
  <p id="zoEE">Полностью код можно посмотреть тут: </p>
  <p id="3GXW"><a href="https://github.com/olticher/math_ling/blob/main/pitchfork.ipynb" target="_blank">https://github.com/olticher/math_ling/blob/main/pitchfork.ipynb</a></p>
  <p id="ALSz"></p>
  <p id="Cnsp"><em>P.S. Большое спасибо Антону Александрину за совместную работу над этим проектом!</em></p>

]]></content:encoded></item></channel></rss>