Как экспортировать ваши помеченные элементы из Google Reader
Если ваша реакция на объявленную гибель Google Reader была криком «Но мои избранные предметы!», Тогда это учебник для вас. Читайте дальше, поскольку мы покажем вам несколько способов извлечь все ваши избранные статьи из Google Reader.
Почему я хочу это сделать?
Google Reader закрывается 1 июля. Если вы, как и миллионы поклонников RSS по всему миру, были поклонниками Google Reader, есть большая вероятность, что вы использовали функцию звездочки, чтобы пометить статьи, чтобы удержать их, прочитать позже или для каких-то других целей..
Если вы хотите быть уверены, что все эти помеченные статьи в целости и сохранности, несмотря на надвигающуюся имплантацию Google Reader, вам нужно будет выполнить несколько незначительных шагов, чтобы убедиться, что у вас есть данные, и что их не оставят без внимания. Серверы гугл.
Когда вы закончите следовать учебному пособию, у вас будет (как минимум) файл, содержащий все ваши помеченные элементы и (в зависимости от того, с каким сегментом урока вы хотите следовать вместе) помеченные элементы в более удобной для пользователя форме. дружеский формат.
Однако в этом нет ничего, что могло бы помочь с экспортом или магией автоматизации, и это на самом деле обработка содержимого помеченных статей. Если вы играли главные роли в статьях для чтения позже в течение многих лет, вы, вероятно, будете шокированы тем, сколько экспортируемых статей генерирует этот процесс. Возможно, вам просто придется отводить немного времени каждый день на несколько недель, чтобы поочередно копаться в получающемся дампе..
Экспорт данных Google Reader с помощью Google Takeout
Самый первый заказ для бизнеса - просто получить копию всех ваших данных Google Reader прямо в вашем распоряжении. Таким образом, независимо от того, что произойдет с вашими данными Reader на серверах Google в будущем, у вас будет копия для работы с ними..
Google Takeout - отличный инструмент для извлечения ваших данных из всех видов сервисов Google, но нам нужен только Reader для этого урока. Посетите подраздел Reader инструмента Google Takeout здесь. Это займет некоторое время, чтобы рассчитать размер файла Takeout. После завершения нажмите «Создать архив»..
Несмотря на то, что он экспортирует не весь аккаунт Google, а лишь небольшую его часть, процесс занимает удивительно много времени. Мы бы рекомендовали проверить «Напишите мне, когда будете готовы» и собираетесь взять чашку кофе.
Когда все это будет сделано, нажмите кнопку «Загрузить», которая появится в правом нижнем углу..
Идите вперед и распакуйте архив в рабочий каталог, такой как Мои документы, и поместите сам архив в безопасное место. Архивные файлы расположены так:
[email protected].
… [email protected]
… Читатель
… Follow.json
… Follow.json
… Понравилось.json
… Notes.json
… Совместно с последователями.json
… Shared.json
… Starred.json
… Subscription.xml
В архиве есть два типа файлов: JSON и XML. Файлы JSON (нотация объектов JavaScript) - это просто тип формата обмена данными, а файлы XML (расширяемый язык разметки) - удобный способ разметки документа, чтобы его можно было читать как на компьютере, так и на человеке. Файл, который нас больше всего интересует для этого урока, - это файл starred.json, поскольку он содержит все записи для ваших помеченных элементов..
Однако в общей схеме освобождения ваших данных из Google Reader и перехода на более зеленые пастбища важен файл subscription.xml. Этот файл содержит все ваши подписки RSS и, если вы хотите импортировать все свои старые подписки из Google Reader в новое приложение RSS, это файл, который вы будете использовать для этого. Обязательно храните его (и оригинальный архив, загруженный из Google Takeout) в надежном месте..
Преобразование помеченных элементов в закладки
Один из самых простых способов справиться с файлом JSON - это использовать JSONview (расширение, доступное как для Firefox, так и для Chrome). Этот метод лучше всего подходит для читателей с небольшим количеством помеченных элементов в Google Reader (менее 1000).
Установите расширение для соответствующего браузера, а затем просто перетащите файл starred.json на новую панель браузера. Сохраните полученный файл как документ HTML. Затем вы можете повернуть направо и импортировать HTML-документ в выбранный вами веб-браузер, и он будет импортировать все ссылки в виде новых закладок..
Однако у этой техники есть два недостатка. Во-первых, вы получите несколько дублирующих URL-адресов в файле закладок, так как URL-адрес домена / основного источника статей, которые вы часто отмечали (например, статьи из How-To Geek), будет появляться несколько раз. Это немного раздражает, но не так уж важно.
Вторым недостатком является нарушение условий для людей с большим количеством помеченных предметов (те из нас, у кого тысячи и тысячи помеченных предметов); когда имеешь дело с действительно огромным импортом HTML, большую часть времени он просто выпадает и никогда не заканчивается. Очевидно, что это крайне неудовлетворительное решение для опытных пользователей Reader, так как оно никогда не завершает импорт ваших помеченных элементов. Если вы опытный пользователь и вам нужно иметь дело с тысячами помеченных элементов, импортировать их в виде закладок просто не поможет..
Преобразование помеченных элементов в отдельные ссылки (и импорт в Evernote)
Для пользователей, которым требуются большие вычислительные мощности (тип обработки, который может обрабатывать более 5000 элементов со звездой за несколько минут), мы обращаемся к Python, чтобы помочь нам разобраться в нашем огромном списке.
С разрешения Paul Kerchen и Davide Della Casa, двух опытных пользователей Google Reader, которые хотели экспортировать все свои старые помеченные элементы, у нас есть два очень удобных скрипта Python, которые могут помочь нам сделать одну из двух вещей: 1) преобразовать все записи помеченных элементов в отдельные документы HTML и / или 2) импортировать все наши помеченные элементы в Evernote.
Для обоих приемов в вашей системе должен быть установлен Python. Возьмите копию Python для вашей операционной системы и установите ее, прежде чем продолжить.
После установки Python посетите сайт для проекта экспорта в Google Reader компании Kerchen / Casa и сохраните файлы export2HTMLFiles.py и export2enex.py в ту же папку, в которую вы распаковали свой файл starred.json..
Если вы хотите преобразовать все свои помеченные элементы в отдельные HTML-файлы, вы можете сделать это с помощью export2HTMLFiles.py, выполнив следующую команду в каталоге, где хранится ваш файл starred.json:
python export2HTMLFiles.py
(Если python не обозначен как общесистемная команда на вашем компьютере, замените «python» на полный путь к исполняемому файлу python, например, C: \ Python2.7 \ python.exe)
В зависимости от количества отмеченных вами элементов этот процесс может занять от нескольких секунд до нескольких минут. Во время нашего теста потребовалось около трех минут, чтобы разорвать 12 000 отмеченных звезд.
Когда это будет сделано, у вас будет ряд пронумерованных и именованных HTML-файлов (например, 1 статью, в которой вы пометили.html до 10000, другую статью, которую вы пометили, starred.html). Самый простой способ просмотреть их все - просто загрузить локальный каталог в веб-браузер..
Это отличный способ освободить ваши помеченные элементы из Google Reader и файла JSON, но, как мы упоминали ранее в этом руководстве, если вы сохраняете статьи, чтобы прочитать их позже в течение многих лет, у вас будет грандиозная задача по ваши руки.
Одним из способов лучше справиться с этой задачей является использование Evernote в качестве рабочего пространства для сортировки, маркировки и возможного удаления ненужных помеченных элементов..
Есть два способа импортировать элементы в Evernote. Вы можете импортировать файлы HTML, которые мы создали недавно, с помощью папки импорта. В вашем клиенте Evernote для рабочего стола вы можете перейти в Инструменты -> Импортировать папки и затем создать папку дампа для файлов HTML. Мы создали подпапку в папке / Reader / work под названием «Импорт» и новый блокнот в Evernote под названием «Помеченные элементы». Перетаскивая HTML-файлы в папку / Reader / Imports /, мы можем импортировать их как отдельные заметки в папку Evernote Starred Items. Они постоянно хранятся там для просмотра на нашем досуге.
В качестве альтернативы, если вы хотите конвертировать все свои помеченные элементы в собственный блокнот Evernote одним махом, вы можете использовать второй загруженный скрипт Python, export2enex.py, чтобы сделать это. Преимущество этого состоит в том, что он немного лучше сохраняет форматирование документов..
В папке, где находится файл starred.json, выполните следующую команду:
python export2enex.py> StarredImport.enex
Возьмите полученный файл StarredImport.enex и импортируйте его в настольный клиент Evernote, используя Файл -> Импорт -> Экспорт файлов Evernote..
К этому моменту вы полностью удалили свои помеченные элементы из Google Reader и готовы приступить к (потенциально длительному) бизнесу по сортировке кучи..
У вас есть умный способ манипулировать файлом JSON и извлекать помеченные элементы? Присоединяйтесь к обсуждению ниже и поделитесь своими советами и советами с другими читателями..