September 10, 2013

✂ GRAB'им фликр, гугло-пикасу и прочие прижимистые хосты

Грузите картинки бочками пачками - эквилибристика автозамены
Совершенно незаслуженно вне широкой практики остается такой удобный и простой инструмент, как автозамена.Текстовые редакторы типа Блокнота способны на решение куда более изощренных задач,чем простые "Найти далее" и "Заменить чем". К удивлению пользователей, не подозревающих о секретах автозамены, не хитрым и доступным методам автоматизации (без скриптов-плагинов-специализированных сервисов) поддается значительный круг действий, с которыми сталкиваются напр. авторы, использующие в своих записяхбольшое количество линков и ссылок, требующих определенного оформления.

Продолжение темы Как без хлопот запостить полсотни фот

Без предисловий и лирических отступлений - прямо к делу (работает при открытом кате):
                              Google-pikasa           Flickr

◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘ ◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘

Только что расхваливала myopera.com где, при всем минимализме интерфейса,
сохраняются имена файлов, как вдруг - сюрприз: майопера убрала флеш-загрузку. Если
грузить фоты по одной, то уже все равно, удобно ли быстро их извлечь.
Пинок вообще-то даже полезный, пора было задуматься о смене хоста, поскольку
стоило просмотрам подойти к сотне, МуО подвисала и прекращала отдавать картинки.

Обхожу старых знакомцев

О, здравстуй Рамблер - Новыйгод! Фотохост закрылся, кто не прозевает, успеет слить запасы.

У Пикаса какие-то странные телодвижения.
Жа(ба)-альбум. Занятный, с необычными флеш-функциями, решил стать
совсем эксклюзивным и платным. Контент мой тамошний куда-то сгинул.

Ipernity, вход рубль - выход три.
Всегда рассматривала его как запасной аэродром "если тут вдруг что", у меня там даже полузабытый блог на эсперанто.
Креативно подошли к монетизации. Загрузить фоты - ок. Выгрузить ссылку - подпишись на обслуживание.
Самое прикольное - фотки прикрыты однопиксельным прозрачным гифом. Что не значит
абсолютной неизвлекаемости, но такой бронетанковый сервис не привлекает.

Некогда сопряженный с ЖЖ Фотобукет названий файлов не искажает, и ничем бы не хуже МайОперы,
еслиб не ограничения по объему загруженного, из-за чего когда-то с него съехала.

Все-таки предпочитаю соц.сеть, графический интерфейс, альбомы,
а не файлохранилище вроде Дропбокса.

Майл.ру изменяет имена файлов, но регулярным образом, всему альбому присвоен одинаковый суффикс,
достаточно посмотреть одну ссылку - остальные строить по образу и подобию.

(Из комментов: Радикал стал уничтожать фотки... )

◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘ ◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘

У гугло-пикасы ссылки содержат непредсказуемого вида набор символов.
Адреса тоже можно добывать на одной странице, там, где эскизы к альбому, но копировать придется по одному.

Более продвинутый способ:
из браузера -> левым кликом мыши(или у кого что) -> исходный код. Благо у пикасы блок нужных
ссылок собран компактной группой.

Тут уже речь не идет, смотрибелен или нет пост с десятками иллюстраций.
Даже если вы в последствии разобьете материал на двадцать частей, выудить ссылки одним пакетом
куда как удобней, чем тыкаться в каждую картинку, перезагружать страницу раз за разом.

Получить коды элементарно, а вот что делать, буде мы захотим переехать
со всем этим богатством на новый хост (или будем вынуждены)?

По одной в каждом посте заменять всю эту абракадабру на новый адрес? Вручую - рехнешься трудоемко.

Есть выход.

Берем Блокнот - обычный текстовый редактор. Только не скудный виндозный, чуть более функциональный.
АкелПад http://akelpad/download
(по желанию notepad++ итп).

На вид блокнот, как блокнот.
Отличие в деталях

в диалоге "Поиск и замена" обнаруживаем опцию "Регулярные выражения".
Их-то нам и нужно.

***** ******

Чтобы заменить адреса с гуглевских напр. на МуОперу

В строку "Что" вбиваем заклинание:

\https://lh(?:4|3|5|6).\S*\/s128/IMAGE_

в "Чем":
http://files.myopera.com/lus/albums/14279792/

К счастью конечные цифры при джипегах - 320.jpg не хостовские, это исходные имена загруженных файлов, к ним и привязываем автозамену.
Достаточно локальные файлы с теми же именами загрузить на новый хостинг(не искажающий имен) и автозаменой подставить новый формат адресов.
- А почему не загрузиться из локалки и все, при чем тут прежний хостинг?
- Для меня напр, потому, что "рыбой" пользоваться догадалась не сразу, во многих прежних постах картинки расположены в каком угодно порядке и поименованы как бог на душу положит. Считай заново весь пост перекраивать, расставлять иллюстрации. (Тем более что фоты, вошедшие в рассказ, хранятся в папке вместе с кучей других).

***** ******

Есть способ убрать активные ссылки из скопированного исходного кода

На этот случай в "Что" вставляем:
\<div>\<a\s\S*(<img src\S*)\S*\s\S*\</div>

В "Чем":
\1

Курсор на верх страницы, отмечаем флаг "вниз" и "Регулярные выражения" ->"Заменить все" -
получаем ссылки, очищенные от лишнего кода.

Магическая формула говорит редактору - убрать всё от div до /div, кроме конструкции с img src.
(можно еще сократить, часть знаков оставлена для наглядности)

◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘ ◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘

Многопопулярный, навороченный и модернизированный Фликр.

Чудеса флештехнологии, красоты дизайна, синхронизация с ФБ, Ттт, ВК, чертомлысым, ЖЖ похоже нет.
Синхронизируется каждая картинка по отдельности. Так же как и ссылки выдает. В три клика.
Хитрый Фликр. Тут такой номер не пройдет, как в пикасе - подсмотреть адреса фото на странице превьюшек.
Превью ссылаются на НТМЛ-страницу. Ничего общего с искомым адресом.

На хитрый хост найдется блокнот с автозаменой.

Превьюшки -> левый клик мыши в браузере -> исходный код.

Вот они родимые. Наши картинки. (Мы никого не грабим на самом деле,
все законно, разве что через заднюю калитку)
Только в отличии от предыдущего примера, тут в кодах черт ногу сломит нужные
ссылки рассыпаны как горох по щебню. Без трюков не обойтись.

Скажем Акел-паду заветное слово

Что: [^у]*<img \S*\s(src="http://farm\d{1,2}\S*\.jpg")\S*\s*\S*\s*\S*\s*\S*\s*\S* border="0"> Чем: \n\<img \1 border="0">

Флаги - "Регулярные выражения", "Вниз", курсор на верху страницы, "Заменить всё"

- и вот они, чистые ссылки!

Примечание.
Лучше копировать не весь километровый исходный код, чтоб не увязнуть с автозаменой.
Поиск (cntr F для ФФ и Оперы) по выражению: img id="photo_img
с низу страницы, выйдем на последнюю из нужных ссылок, скопипастим все, что выше.

(На платном акке есть вариант попытаться захватить список линков при FTP-передаче, через Семджик напр,
может окажется проще.)
АПД
http://www.saleensoftware.com/FlickrDownloader обещает пакетное скачивание и для бесплатных акков.
А также https://addons.mozilla.org/ru/firefox/addon/flickr-original-10049/ плагин для ФФ.

◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘ ◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘

Яндекс выдает линки всех выбранных картинок разом, что хорошо. Но меняет имена файлов до неузнаваемости.
Получив список, с ним больше ничего не сделаешь. Не оформишь на свой вкус.
(Хотя активные ссылки, загромождающие код, убрать можно, аналогичным выше описанному способом)
Не переконвертируешь в случае переезда, как в Пикасе, где хоть следы оригинального названия сохраняются.
(В несколько приемов, с экселем, и это преодолимо, но излишне хлопотно)
И вообще у меня зуб на Яндекс, с еще доЯ-яндексного воплощения,
когда он пожевал пожал фоты без предупреждения.

◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘ ◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘

Для перебазирования выбрала -

fotki.com - чего тольно нет, чаты-блоги-форумы-виджеты бассейн с вертикальным взлетом
тоже выдает ссылки списком и много чего еще.

Сервис получения ссылок малость недокручен. Все хорошо, на одной странице,
авто-копирование по клику. По отдельности каждый линк.
Выделить все - копируется вместе с подписями к превью.

Увы, шаблоном-"рыбой" не воспользуешься, есть непредсказуемые числовые включения в ссылках.
Что делать, пошаманим.

Трахтибидокс RegExp с мусорным текстом легко справляется

jpg\[^&]*\http
\[^&]*\ заменить на пробел + перевод строки.

Но вот задача - вставить в код элемент title="nomo_01" с последовательным индексом
(подсказка, всплывающая по наведению. по-мне это эстетичней, чем номера над фото).

Типа такого должно получиться:
<img alt="описание" src="http://cdn1.share.slickpic.com/u/Rimlus9/FromOpera/org/makrofrukt_001-vi/web/web.jpg" title="имя_01"> <img alt="описание" src="http://cdn1.share.slickpic.com/u/Rimlus9/FromOpera/org/makrofrukt_002-vi/web/web.jpg" title="имя_02">

Решение проглядывает в том, чтоб привязаться к номерам джипегов.

Путь к заклинанию был труден и тернист.
Две пары железных сапог истоптала - двое суток чистого времени ушло чтобы пробиться
сквозь неведомые письмена и припасть к магическому источнику.

Справка AkelPad-а:
(шаблон) Находит соответствие шаблону и сохраняет его. К сохраненному соответствию можно обратиться через обратные ссылки \0...\9. Чтобы не группировать выражение, а найти скобки "(" или ")", используйте '\(' или '\)'.

полстранички скупого текста, писанного технарями, напоминает пояснение к лото
из "Подкидыша" - "....причем третий все время выбрасывает".

Самый заманчивый и легкий путь - спросить знающих людей. Но - в соответствии с неизменным "пусть со мной
случается не то, чего мне хочется, а то, что мне полезно", знающие сочли, что излагать такому чайнику логику
регулярных выражений все равно, что котенку устройство самолета.

Наиболее вменяемое объяснение для чайников нагуглилось в http://phpclub.ru.
Не сразу нагуглилось.
Чтобы составить продуктивный запрос, пришлось наугад порыться в "регэкспишных" темах,
где спецы препираются на таком языке, что хочется попросить "а можно тоже самое по-китайски?"
Синтаксис выражений для РНР оказался частично похож на то, что требуется.
Дальше методом тыка удалось выкристаллизовать необходимое заклинание:

Что: (frukt_0)([0-9][0-9])(-vi.jpg") Чем: \1\2-vi.jpg" title="nomo_\2"

Окончательная формула, для преобразования скопированного кода в "рыбу" с подложками под фото,
за один шаг:

Что: [^&]*\ http:(\S*\FonoName_0)(\d{2})(-vi.jpg) Чем: \n\n\<div style="BACKGROUND: #d8e6dc; TEXT-ALIGN: center; PADDING-BOTTOM: 25px; PADDING-TOP: 25px; WIDTH: 1000px; border-radius: 9px; box-shadow: 2px 1px 4px #40310a"><img src="http:\1\2\3" title="nomo_\2" alt="opisanie"></div>

Я не знаю Питона с Си-бемолем и РНР понаслышке,
в анамнезе Фортран с перфокартами и слегка НТМЛ на курсах от мультицентра
(когда-то дедушку подопечного туда метапелила сопровождала, и сама приобщилась).

Была не очевидна разрешимость задачи, умеет ли Акел-Блокнот проделывать такие трюки в штатном режиме.
Разговоры небожителей с Акел-форума наводили как раз на мысль о невозможности, без скриптов.
А хотелось попросту.
Не потому, что с приставными модулями сложно, может быть как раз наоборот - есть такие,
что автоматом извлекают ссылки, нумеруют строки и кучу всего еще способны проделать с кодами.
Из методических соображений хотелось обойтись минимальным инструментарием.
Чтобы рассказать об удобном способе таким же занятым и непродвинутым бабушкам, как я.
В двух словах, а не курсом лекций об установке плагинов и сопряжении скриптов.

◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘ ◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘◘

Окончательное украшательство - оформление картинок блоками-подложками,
простой автозаменой.