Как исправить текст в ворде скопированный из пдф
Перейти к содержимому

Как исправить текст в ворде скопированный из пдф

PDF в WORD (DOCX): 10 способов конвертирования!

Вопрос от пользователя

Добрый день.

Подскажите пожалуйста. У меня есть один файл формата PDF, и мне нужно его отредактировать (поменять часть текста, поставить заголовки и выделения). Думаю, что лучше всего такую операцию провести в WORD.

Как конвертировать этот файл в формат DOCX (с которым работает WORD)? Пробовала несколько сервисов, но некоторые выдают ошибку, другие — переносят текст, но теряют картинки. Можно ли сделать лучше?

Марина Иванова (Нижний Новгород)

Да, в офисной работе время от времени приходится сталкиваться с такой задачей. В некоторых случаях, она решается довольно легко, в других — всё очень непросто 👌.

Дело в том, что PDF файлы могут быть разными:

  1. в форме картинок : когда каждая страничка представляет из себя фото/картинку, т.е. текста там нет в принципе. Самый сложный вариант для работы, т.к. перевести это все в текст — это все равно что работать со сканированным листом (у кого есть сканер — тот поймет 😉). В этом случае целесообразно пользоваться спец. программами;
  2. в форме текста : в файле есть текст, который сжат в формат PDF и защищен (не защищен) от редактирования (с этим типом, как правило, работать легче). В этом случае сгодятся и онлайн-сервисы, и программы.

В статье рассмотрю несколько способов преобразования PDF в WORD. Думаю, что из них каждый для себя сможет найти самый подходящий, и выполнит сию задачу ☝.

Правка PDF-файлов

В этом курсе:

  • Сохранение документа
    Статья
  • Преобразование или сохранение в формате PDF
    Статья
  • Правка PDF-файлов
    Статья
  • Печать документа
    Статья
  • Печать конвертов
    Статья
  • Создание и печать наклеек
    Статья
  • Печать наклеек для списка рассылки
    Статья

Правка PDF-файлов

Совет. Видео не на вашем языке? Попробуйте выбрать Скрытые субтитры .

Чтобы изменить PDF-файл, просто откройте его в Word. Преобразование лучше всего работает с PDF-документами, содержащими преимущественно текст.

Выберите Файл > Открыть.

Найдите PDF-файл и откройте его (для этого может потребоваться нажать кнопку Обзор и найти файл в папке).

Появится предупреждение о том, будет создана копия PDF-файла, преобразованная в поддерживаемый формат. Исходный PDF-файл при этом не изменяется. Нажмите кнопку ОК.

Примечание: Полного постраничного совпадения преобразованного документа с исходным может и не быть. Например, разрывы строк и страниц могут находиться в других местах.

Кракозябры при копировании из PDF в Word

Кракозябры при копировании из PDF в Word

При при копировании текста из некоторых файлов PDF в Word получаются кракозябры.
Например:

Помощь в написании контрольных, курсовых и дипломных работ здесь.

Вложения

stgnrbonmeetn.pdf (223.4 Кб, 61 просмотров)

Кракозябры при копировании из PDF
Если кто разбирается посмотрите пожалуйста приложенный файл. С виду текст нормальный, но при.

Символы Юникода, написанные в FPC, при копировании в блокнот выдают кракозябры
Доброго времени суток, почему после символы юникода написанные в free pascal , при копировании в.

При копировании кода из pdf появляются ошибки
Здравствуйте. Скажите, почему при копировании кода в компилятор с сайта, он не выполняется.

Квадратики в ворде при копировании текста из PDF документа
Добрый день. Ребята подскажите по такому вопросу. Пытаюсь скопироавть текст из PDF документа в.

Вложения

ворд.rar (268.6 Кб, 364 просмотров)

Спасибо, antal10!
Но меня интересует не конкретно этот файл, а теоретический ответ на данный вопрос.
Данный файл я привел только в качестве примера.

Еще раз повторю вопросы:
1. Каким образом при формировании файла PDF была создана такая проблема с кракозябрами?
2. Как скопировать текст из подобного файла PDF в Word без распознавания текста.

Сообщение было отмечено Alex_Gur как решение

Решение

Сообщение от Alex_Gur
Сообщение от Alex_Gur

Та же самая проблема, но несколько под другим углом.

В редакции делается верстка газеты, а потом она преобразуется в PDF. Если с PDF-страницы газеты скопировать в Word кусок текста, то происходит уже описанное здесь — в Word появляется несколько абзацев кракозябр.
Методом тыка выяснилось, что возникает такое из-за изменения кодовой страницы. Вставляется почему-то в 1252 (CP-1252), хотя должно происходить в нормальной 1251.

Преобразовать скопированный текст обратно в CP-1251 не проблема, нашел в Сети кучу рекомендаций, как это сделать. Но хотелось бы устранить первопричину этого вывиха, чтобы копировалось без проблем. А пока не очень понятно с чего это вообще возникает.
Вот сверстанный текст — все вроде бы в порядке, видимых нарушений нет. В Acrobat Distiller делаем из него PDF -тоже вроде бы проходит без проблем, сообщений об ошибках нет. Открываем полученный PDF — тоже все нормально.
Но если попробовать из него что-то скопировать — кракозябры.

Добавить комментарий

Ваш адрес email не будет опубликован.