Домашняя » как » Как извлечь изображения, текст и встроенные файлы из документов Word, Excel и PowerPoint

    Как извлечь изображения, текст и встроенные файлы из документов Word, Excel и PowerPoint

    Скажем, кто-то прислал вам документ Word с большим количеством изображений, и вы хотите, чтобы вы сохранили эти изображения на жестком диске. Вы можете извлечь изображения из документа Microsoft Office с помощью простого трюка.

    Если у вас есть файл Word (.docx), Excel (.xlsx) или PowerPoint (.pptx) с вложенными изображениями или другими файлами, вы можете извлечь их (а также текст документа), не сохраняя каждый файл отдельно. , И самое главное, вам не нужно никакого дополнительного программного обеспечения. Форматы файлов на основе Office XML - docx, xlsx и pptx - на самом деле представляют собой сжатые архивы, которые можно открыть, как и любой обычный файл .zip в Windows. Оттуда вы можете извлекать изображения, текст и другие встроенные файлы. Вы можете использовать встроенную поддержку .zip в Windows или приложение, такое как 7-Zip, если хотите.

    Если вам нужно извлечь файлы из старого офисного документа, такого как файл .doc, .xls или .ppt, вы можете сделать это с помощью небольшого бесплатного программного обеспечения. Мы подробно опишем этот процесс в конце этого руководства.

    Как извлечь содержимое нового офисного файла (.docx, .xlsx или .pptx)

    Чтобы получить доступ к внутреннему содержимому документа Office на основе XML, откройте проводник (или проводник Windows в Windows 7), перейдите к файлу, из которого вы хотите извлечь содержимое, и выберите файл..

    Нажмите «F2», чтобы переименовать файл и изменить расширение (.docx, .xlsx или .pptx) на «.zip». Оставьте основную часть имени файла в покое. Нажмите «Enter», когда вы закончите.

    В следующем диалоговом окне отображается предупреждение об изменении расширения имени файла. Нажмите «Да».

    Windows автоматически распознает файл как заархивированный файл. Чтобы извлечь содержимое файла, щелкните правой кнопкой мыши файл и выберите «Извлечь все» во всплывающем меню..

    В диалоговом окне «Выбор места назначения и извлечение файлов» путь к папке, в которую будет извлечено содержимое файла .zip, отображается в поле «Файлы будут извлечены в эту папку». По умолчанию папка с тем же именем, что и имя файла (без расширения файла) создается в той же папке, что и файл .zip. Чтобы извлечь файлы в другую папку, нажмите «Обзор».

    Перейдите туда, куда вы хотите извлечь содержимое файла .zip, щелкнув «Новая папка», чтобы создать новую папку, если это необходимо. Нажмите «Выбрать папку».

    Чтобы открыть окно проводника (или проводника Windows) с папкой, содержащей извлеченные файлы, которые отображаются после их извлечения, установите флажок «Показать извлеченные файлы после завершения», чтобы в нем была отметка. Нажмите «Извлечь».

    Как получить доступ к извлеченным изображениям

    В извлеченное содержимое включена папка с именем «word», если исходный файл является документом Word (или «xl» для документа Excel или «ppt» для документа PowerPoint). Дважды щелкните папку «word», чтобы открыть ее.

    Дважды щелкните папку «медиа».

    Все изображения из исходного файла находятся в папке «media». Извлеченные файлы являются исходными изображениями, используемыми в документе. Внутри документа может быть установлено изменение размера или другие свойства, но извлеченные файлы являются необработанными изображениями без применения этих свойств..

    Как получить доступ к извлеченному тексту

    Если на вашем компьютере не установлен Office, и вам нужно извлечь текст из файла Word (или Excel или PowerPoint), вы можете получить доступ к извлеченному тексту в файле «document.xml» в папке «word»..

    Вы можете открыть этот файл в текстовом редакторе, таком как Блокнот или WordPad, но его легче прочитать в специальном редакторе XML, таком как бесплатная программа XML Notepad. Весь текст из файла доступен в виде фрагментов простого текста независимо от стиля и / или форматирования, применяемых в самом документе. Конечно, если вы собираетесь загрузить бесплатное программное обеспечение для просмотра этого текста, вы также можете загрузить LibreOffice, который может читать документы Microsoft Office..

    Как извлечь вложенные OLE-объекты или вложенные файлы

    Чтобы получить доступ к встроенным файлам в документе Word, когда у вас нет доступа к Word, сначала откройте файл Word в WordPad (который встроен в Windows). Вы можете заметить, что некоторые значки встроенных файлов не отображаются, но они все еще там. Некоторые из встроенных файлов могут иметь частичные имена файлов. WordPad не поддерживает все функции Word, поэтому некоторые материалы могут отображаться неправильно. Но вы должны иметь возможность доступа к файлам.

    Если щелкнуть правой кнопкой мыши один из встроенных файлов в нашем примере файла Word, одним из вариантов будет «Открыть объект PDF». Это открывает файл PDF в программе чтения PDF по умолчанию на вашем компьютере. Оттуда вы можете сохранить файл PDF на жесткий диск.

    Если у WordPad нет возможности открыть файл, запишите его тип файла здесь. Например, наш второй файл в этом документе - файл .mp3.

    Затем вернитесь в папку «Files from [Document]» и дважды щелкните папку «embeddings» внутри папки «word»..

    К сожалению, типы файлов не сохраняются в именах файлов. Вместо этого все они имеют расширение «.bin». Если вы знаете, какие типы файлов встроены в файл, вы, вероятно, сможете определить, какой файл какой по размеру файла. В нашем примере у нас был файл PDF и файл MP3, встроенный в наш документ. Поскольку файл MP3, скорее всего, больше, чем файл PDF, мы можем выяснить, какой файл какой, по размеру файлов, а затем переименовать их, используя правильные расширения. Ниже мы переименовываем файл MP3.

    Обратите внимание, что не все файлы будут обязательно открываться с помощью этого процесса - например, наш файл PDF правильно открылся из WordPad, но мы не смогли открыть его, переименовав его .bin файл.

    После того как вы извлекли содержимое zip-файла, вы можете вернуть расширение исходного файла обратно в .docx, .xlsx или .pptx. Файл останется без изменений и может быть нормально открыт в соответствующей программе..

    Как извлечь изображения из старых офисных документов (.doc, .xls или .ppt)

    Если вам нужно извлечь изображения из документа Office 2003 (или более ранней версии), есть бесплатный инструмент под названием «Мастер извлечения изображений Office», который облегчает эту задачу. Эта программа также позволяет извлекать изображения из нескольких документов (одного и того же или разных типов) одновременно. Загрузите программу и установите ее (есть также портативная версия, если вы не хотите ее устанавливать).

    Запустите программу, и появится экран приветствия. Нажмите кнопку "Далее".

    Сначала нам нужно выбрать файл, из которого вы хотите извлечь изображения. На экране ввода и вывода нажмите кнопку «Обзор» (значок папки) справа от поля редактирования документа..

    Перейдите в папку, содержащую нужный документ, выберите его и нажмите «Открыть»..

    Папка, содержащая выбранный файл, автоматически становится папкой вывода. Чтобы создать в этой папке подпапку с именем, совпадающим с выбранным файлом, установите флажок «Создать папку здесь», чтобы в нем была отметка. Затем нажмите «Далее».

    На экране Ready to Start нажмите «Start», чтобы начать извлечение изображений..

    Следующий экран отображается в процессе извлечения.

    На экране Готово нажмите «Нажмите здесь, чтобы открыть папку назначения», чтобы просмотреть полученные файлы изображений..

    Поскольку мы решили создать подпапку, мы получаем папку, содержащую файлы изображений, извлеченные из файла.

    Вы увидите все изображения в виде пронумерованных файлов..

    Вы также можете извлечь изображения из нескольких файлов одновременно. Для этого на экране «Ввод и вывод» установите флажок «Пакетный режим», чтобы в нем была отметка..

    Отображается экран пакетного ввода и вывода. Нажмите «Добавить файлы».

    В диалоговом окне «Открыть» перейдите к папке, содержащей любые файлы, из которых вы хотите извлечь изображения, выберите файлы с помощью клавиш «Shift» или «Ctrl», чтобы выбрать несколько файлов, и нажмите «Открыть»..

    Вы можете добавить файлы из другой папки, снова нажав «Добавить файлы», перейдя в папку в диалоговом окне «Открыть», выбрав нужные файлы и нажав «Открыть»..

    После того как вы добавили все файлы, из которых вы хотите извлечь изображения, вы можете создать отдельную папку для каждого документа в той же папке, что и каждый документ, в который будут сохраняться файлы изображений, нажав «Создать папку для каждый документ », поэтому в поле есть галочка.

    Вы также можете указать для папки «Выход» значение «То же, что и для входной папки каждого файла», либо ввести или выбрать пользовательскую папку, используя поле редактирования и кнопку «Обзор» под этой опцией. Нажмите «Далее», как только вы выбрали нужные параметры.

    Нажмите «Пуск» на экране «Готов к запуску».

    На следующем экране отобразится процесс извлечения.

    Количество извлеченных изображений отображается на экране Готово. Нажмите «Закрыть», чтобы закрыть мастер извлечения изображений Office.

    Если вы решили создать отдельную папку для каждого документа, вы увидите папки с такими же именами, что и файлы, содержащие изображения, независимо от того, какие выходные папки вы указали.

    Опять же, мы получаем все изображения в виде пронумерованных файлов для каждого документа.

    Теперь вы можете переименовывать изображения, перемещать их и использовать в своих собственных документах. Просто убедитесь, что у вас есть права использовать их на законных основаниях.