Как считать слова веб-страницы

  1. Вариант 1: клиент предоставляет нам все веб-файлы
  2. Вариант 2: клиент только дает нам свой веб-адрес
  3. Другие варианты: WordPress и Easyling

Когда речь идет о бюджете на локализацию и перевод веб-страницы, мы должны знать количество слов, которые нам придется перевести. Это легко сделать в случае файла Microsoft Office или Acrobat (см. Предыдущую статью на Как считать слова в документе ), это не так просто в случае веб-страницы, так как она содержит внутренний код, такой как метатеги, заголовки, альтернативный текст изображений и т. д., который почти важнее перевести, чем сам текст, для позиционирования нашего веб-страница в основных поисковых системах.

Возможность избежать подсчета слов состоит в том, чтобы составить бюджет исходя из предполагаемых часов, которые мы посвятим проекту, но это еще сложнее, особенно если нам нужно выполнить перевод непосредственно в менеджере контента (WordPress, Joomla, Drupal и т. Д.). ), с которым мы не знакомы.

Чтобы подсчитать количество слов на веб-сайте, есть два варианта : клиент может предоставить нам все файлы для перевода (в формате html, xml, txt, xliff и т. Д.) Или просто предоставить нам адрес своего веб-сайта. ,

Вариант 1: клиент предоставляет нам все веб-файлы

Это самый простой вариант, поскольку, если у нас есть все файлы веб-сайта (статическая страница или динамическая страница), мы можем сделать это двумя способами:

  • Вспомогательные инструменты перевода (CAT) . Мы должны будем ввести все файлы в нашем любимом инструменте перевода ( Trados , Wordfast , MemoQ , Memsource и т. д.) для выполнения подсчета. Эти инструменты выполняют адекватный подсчет слов, поскольку они «знают» большинство форматов файлов, которые необходимо перевести, и то, как они должны выполнять подсчет, поскольку подсчет html-файла и файла Word - это не одно и то же.
  • Специальные инструменты для подсчета слов . Есть много компьютерных программ (не перевод), чтобы выполнить задачу подсчета слов, как бесплатно ( Абакус переводчика ) в качестве оплаты ( WebBudget , FineCount ). Есть также много интернет-страниц, которые могут сосчитать файлы, но ни одна из тех, которые я пробовал, не убедила меня. Кроме того, если это конфиденциальные документы, это не лучший вариант

Вариант 2: клиент только дает нам свой веб-адрес

Довольно часто клиент сообщает нам адрес своего веб-сайта и хочет получить бюджет на перевод своего веб-сайта. Мы можем запросить файлы с вашего веб-сайта, но часто тот, кто заказывает нам бюджет, не является веб-мастером страницы, а хочет немедленного бюджета. В этом случае у нас есть следующие варианты:

  • Извлеките файлы с веб-страницы . Есть много компьютерных программ, которые позволяют нам извлечь все файлы с веб-страницы, например, HTTrack и затем выполните пересчет с некоторыми из программ, упомянутых в предыдущем разделе. Тем не менее, вариант, который дал мне лучшие результаты, был упомянут в следующем разделе.
  • Посчитай слова онлайн . На рынке существует несколько альтернатив для онлайн-подсчета слов, но я считаю, что лучше всего использовать приложение под названием TransAbacus ( http://www.transabacus.com/ ). Большим преимуществом этого приложения является то, что оно позволяет вести онлайн-счет без необходимости извлекать текст или загружать содержимое веб-сайта. Он также считает текст, который не похож на описание и заголовок.

Он также считает текст, который не похож на описание и заголовок

Это приложение позволяет нам подсчитать следующие элементы:

  1. Тело То есть текст, который пользователи могут читать на веб-странице.
  2. Название. Тег заголовка, который можно увидеть в верхней части браузера на каждой из посещаемых нами страниц.
  3. Описание. Это текст, который описывает страницы сайта в краткой форме. Обычно поисковые системы показывают это в результатах поиска под заголовком ссылки.
  4. Ключевые слова Это список терминов, которые определяют тему веб-страницы. Раньше он широко использовался поисковыми системами, но не сейчас, хотя некоторые российские поисковые системы, такие как Яндекс, все еще имеют их в виду.
  5. Альтернативный текст (Альтернативный текст). Это текст, который пользователь может видеть, когда указатель мыши проходит над изображением. Поисковые системы используют этот текст в поисках изображений, сделанных пользователями.

Тэги Title , Description и Alt text чрезвычайно важны для поисковых систем , поэтому их нужно переводить, когда сайт находится, и, следовательно, они должны учитываться при составлении бюджета на перевод (для Более подробную информацию о метатегах можно найти в статье: « Локализация и перевод веб-страницы на русский язык: метатеги «). Кроме того, у этой программы есть и другие очень интересные опции: она позволяет подсчитывать количество слов в файлах pdf, txt и rtf, связанных с Интернетом, и имеет опцию «Raw Count», которая позволяет TransAbacus игнорировать повторяющиеся фразы, понимая их, строки с тире, запятыми или скобками. Это важный вариант для всех профессиональных переводчиков, которые используют вспомогательные инструменты перевода, такие как Trados.

Пробная версия этой программы позволяет рассчитывать до 5 страниц в сети. Платеж не имеет ограничений, но стоит около 35 долларов , хотя и стоит. Однако в последней пробной версии этой программы (2.0.2.12) есть ошибка, которая заключается в том, что после подсчета первых 5 страниц, если вы нажмете кнопку «Подсчет», подсчитайте еще 5 страниц и т. Д. , так что мы можем посчитать слова всей веб-страницы бесплатно (в последней версии ноября 2013 года эта ошибка была исправлена).

Наконец, прокомментируйте, что при подсчете слов очень часто клиент не хочет переводить определенные разделы вашего сайта, такие как блог , новости , форумы и т. Д., Поэтому мы должны вычесть количество слова, соответствующие этому разделу. Также часто встречаются клиенты, которые не хотят переводить связанные PDF-файлы, содержащиеся на их веб-сайте.

Другие варианты: WordPress и Easyling

Наконец, я добавляю две другие опции для подсчета: первая соответствует диспетчеру содержимого WordPress, а вторая - облачному приложению для локализации и перевода веб-страниц.

  • WordPress и WPML . WordPress, самый распространенный в мире менеджер содержимого веб-сайтов, предлагает различные возможности для перевода веб-страниц (см. Статью: Как сделать наш сайт WordPress на нескольких языках ). Плагин перевода WPML позволяет считать слова, для которых мы должны иметь доступ к серверной части веб-страницы.
  • Easyling. Компания Skawa Innovation Ltd, базирующаяся в Венгрии, разработала веб-решение для облачного перевода под названием Easyling - перевод сайта в 1 клик , Это платежный инструмент (с различными планами), предназначенный для специалистов по переводу (агентств и переводчиков), а также для частных лиц, и позволяет нам также выполнять подсчет слов для составления бюджета. Если мы регистрируемся, мы предлагаем бесплатную 30-дневную пробную версию со всеми функциями сервиса.

Какие варианты вы используете для подсчета слов на веб-странице?

Какие варианты вы используете для подсчета слов на веб-странице?