Распределение csv данных по ячейкам Excel
Рассмотрим, простой способ загрузки первичных данных из csv файла в Excel, и какие при этом могут возникнуть трудности. В демонстрационных целях используются сведения о поединках в рамках американской лиги UFC (получены с сайта ufcstats.com).
Проще всего выделить диапазон со значениями путем перехода на вкладку "Данные" и выбора пункта "Текст по столбцам":
Затем потребуется последовательно выбрать разделитель и указать формат (распознавать все столбцы как текст или попытаться автоматически определить типы). В результате получится следующая таблица:
Аналогичный результат можно получить через механизм импорта данных (на рисунке ниже):
Однако, получив таким образом результат можно столкнуться с неприятностями. Чтобы это увидеть, установите фильтр на поле "Method:" (способ победы):
Сюрприз - появление в формах побед процентных значений. Исследования причин показало, что, например, в строке № 6365 одно из полей (Details:) Excel разбил на две строки:
Если заглянуть в текстовый редактор (например, Notepad++), то увидим символ LF, который для Excel сигнализирует переход на новую строку (заметим, что кроме двух "проблемных" другие строки оканчиваются на 2 символа - CRLF):
Для решения проблемы делаем две замены - сначала "\n" на " ", а затем "\r" на "\r\n":
Теперь все встало на свои места:
Таким образом, если некое поле в исследуемой таблице содержит символ \n, Excel может разбить его на 2 строки. Поэтому будьте осторожны и применяйте указанный выше способ, чтобы избежать некорректный анализ.