На vk.com мы дублируем
важные новости
Старый сайт перестаёт работать
Наш старый сайт old.wordsfromtext.com в самое ближайшее время перестаёт работать.
Он хорошо послужил в течение трёх лет, обслужив в общей сложности около 10000 пользователей. После перехода на новую версию сайта он был оставлен, чтобы сделать переход безболезненным и плавным.
Мы приняли решение в ближайшие дни переехать на другой, более мощный сервер. Это позволит на порядок быстрее делать обработку текстов, особенно мелких. Перевозить старый сайт затратно и, в общем-то, непонятно зачем: на старом сайте давно не обновляется словарь, гораздо хуже работает распознавание слов. Поэтому мы его выключаем.
Всё, что было доступно на старом сайте, бесплатно доступно и на новом, без ограничений по времени.
Все тексты со старого сайта, которых пока нет на новом, будут перенесены. (UPD. уже перенесены.)
Если у кого-то есть трудности с новой версией сайта, и поэтому вы пользуетесь старой, не стесняйтесь нам написать во ВКонтакте или на info@wordsfromtext.com, мы с удовольствием разрешим ваши вопросы.
Новые слова и устойчивые выражения
Мы обновили словарь сайта.
Во-первых, добавили около 500 устойчивых выражений. Сюда входят обычные англоязычные конструкции (a little bit, instead of, all of a sudden, in spite of, in general), а также заимствованные выражения и термины (vice versa, anno domini, in vitro, con moto и т. д.)
Во-вторых, добавлено около 50000 новых слов, что серьёзно расширяет словарь сайта.
Как эти изменения повлияли на реальные тексты:
"Alice's Adventures in Wonderland"
+ 25 устойчивых выражений
+ 5 новых слов
"Surely You're Joking Mr Feynman"
+ 47 устойчивых выражений
+ 46 новых слов
Устойчивые выражения, распознанные в ваших текстах, вы можете просмотреть в списке слов. Для этого надо установить фильтр "Часть речи" в значение "Фраза".
Также сайт теперь поддерживает загрузку текстов в формате от Амазона azw3.
Статистика и предложения в общем списке слов
Ура! В общем списке слов появились предложения из текстов и статистика:
Предложения берутся из ваших текстов.
Максимум показываем 3 предложения, предпочтительно из разных текстов.
Для каждого слова показываем число текстов и общее число употреблений.
Данные доступны, в том числе, при печати и в экспорте.
Поскольку данные вычисляются на основе большого количества загруженных вами текстов, операция пересчёта получается весьма затратной. Из-за этого сейчас есть ограничения:
— Функция доступна только для аккаунтов с полным доступом
(пробных или платных).
— Полный пересчёт данных происходит раз в сутки (ночью по Москве).
Частичный — при добавлении нового текста.
— Числа вычисляются только для слов из вашего словаря (известных и
к изучению).
— Предложения вычисляются только для слов к изучению.
— Пересчёт производится максимум для 500 текстов с наиболее поздним
временем последнего доступа (не такое сильное ограничение,
рекордсмены сейчас имеют 300).
Думаю, позже мы переработаем планировщик задач, и тогда данные будут пересчитываться гораздо чаще, чем раз в сутки. Но пока — так.
Пара вопросов для понимания аудитории (ответить можно здесь: vk.com/wordsfromtext или на info@wordsfromtext.com).
— Нужна ли вам статистика по новым словам (скажем, топ
1000)?
— Нужно ли вам более 3 предложений?
— Действительно ли, как мы думаем, никому не нужны
предложения-примеры в известных словах?
— Что ещё нужно доработать в этой общей статистике?
Улучшение списка текстов
Мы переделали страницу со списком текстов, улучшив её практически во всём:
В списке текстов показана раскладка слов по статусам (новые / к изучению / известные).
Индикатор под текстом помогает понять, какую часть книги вы прочитали.
Добавлен поиск, ищет тексты по заголовкам.
Тексты по умолчанию сортируются по «времени последнего доступа». Это время обновляется при переходе между страницами или при смене статуса слова. Фича доступна только в списке ваших текстов.
Сортировка по времени добавления текста тоже осталась.
По нажатию на «инфо» можно посмотреть подробную статистику по тексту:
Сбой и продление аккаунтов
Вчера (30 апреля) на сайте был 4-часовой сбой, в результате которого не работало отображение переводов.
Причиной явились незапланированные работы хостера, после которых часть наших сервисов не восстановили нормальную работу.
В качестве компенсации мы продлили все оплаченные аккаунты на 2 суток и все пробные аккаунты на 1 сутки.
Также рекомендуем перезагрузить тексты, загруженные 30 апреля с 19:00 до 22:20 по Москве. Даже если они загрузились внешне успешно, часть слов могли быть не распознаны.
Приносим свои извинения. Мы написали дополнительные проверочные скрипты, чтобы в дальнейшем минимизировать вероятность подобных сбоев.
Ошибка в обработке файлов
Сегодня днём (10 апреля) пользователи не могли дождаться, пока загруженный текст будет обработан сервером.
Причина была в устаревшей библиотеке для работы с epub-форматом: библиотека не могла обработать некоторые файлы и, в дополнение, не отключалась по таймауту.
Сейчас проблема исправлена. Все файлы, стоящие в очереди, обработаны. Попутно улучшено декодирование epub-формата.
Приносим свои извинения.
Изменения в настройках
Мы внесли изменения в настройки.
При чтении «слова к изучению» теперь по умолчанию не переводятся, а подчёркиваются, стимулируя самостоятельно вспоминать перевод:
Разумеется, старый режим можно легко вернуть через панель «Настройка отображения». Также теперь можно отключить переводы — отдельно для «новых слов» и для «слов к изучению»:
Положение галочек в списке слов теперь запоминается:
Также появилось управление доступом. Исторически сложилось, что список текстов всех пользователей, а также слова из текстов доступны по прямым ссылкам.
Теперь это можно отключить:
Изменить эту настройку можно по ссылке wordsfromtext.com/settings/#security.
Небольшие улучшения
Мы улучшили интерфейс для чтения, а также алгоритм анализа текста.
По интерфейсу — было:
Стало:
Можно быстро перейти на любую страницу и не бояться, промахнувшись, улететь в конец текста.
Также можно менять размер шрифта при чтении:
Улучшено распознавание «множественных» существительных: physics, pants, belongings, maths, и др.
Многие жалуются на то, что «сложные» слова из текста иногда не распознаются. Мы начали работу над этой проблемой. Добавлено распознавание многих иностранных (по отношению к английскому языку) слов. Иногда это редкие слова, а иногда достаточно распространённые. Примеры: status, vacuum, chef, tennis, helluva и т. д. Работу с этом направлении мы ещё продолжим.
Хочется отметить, что ряд слов не распознаётся по задумке. Мы сейчас намеренно опускаем предлоги, вопросительные слова, числительные и некоторые другие части речи. Это значительно снижает шум в списке слов, позволяя отмечать меньше слов как известные. Однако, основываясь на отзывах, мы планируем включить некоторые слова (такие, как since, despite, whose и др.) в список распознаваемых и отмечаемых.
Озвучка и транскрипции
Мы добавили транскрипции и озвучку.
При чтении нужно нажать на слово:
В списке слов произношение надо специально включить:
Затем оно появится под каждым словом:
«UK» означает, что озвучка сделана человеком из Великобритании
(United Kingdom).
«US» — из Америки (USA).
Иногда бывает так, что произношение разных частей речи одного слова различается. Примеры: contract, attribute, construct и др. В таких случаях мы выдаём имеющуюся озвучку для всех вариантов сразу:
Решение спорное, но мы решили, что лучше сразу показать все варианты, чтобы было с чем сравнить. И чтобы сразу отложилось отличие.
Все произношения сделаны реальными людьми. Вариантов, сгенерированных автоматически из транскрипций, у нас нет. Качество движков TTS (Text-to-Speech), которые мы смогли найти, нас не устроило.
В итоге озвучку мы брали из открытых источников. Это означает, что какие-то люди (native speakers!) сели, записали и выложили озвучку английских слов. Авторы разрешают использовать своё творение всем, хотя иногда просят указать авторство.
Мы решили давать ссылку на источник везде. Значок © ведёт на страницу, где можно узнать автора озвучки, а также скачать файлы. Мы перераспространяем звуковые файлы под теми же лицензиями, под которыми их получили. Если лицензий было несколько, мы отдаём предпочтение варианту Creative Commons.
Фразы и фразовые глаголы
Сегодня мы научились распознавать фразовые глаголы и другие фразовые конструкции.
Пока возможность запущена в тестовом режиме, и мы распознаём только 22 фразовых глагола (наиболее часто используемых) и 30 фразовых конструкций (of course, on behalf of, with respect to, by means of и т. п.) Фразы будут добавляться, но даже то, что есть, уже значительно сокращает ошибки перевода.
Функционал пока работает только для новых текстов. При чтении выглядит так:
Если вы хотите просмотреть список всех распознанных фраз, можно выполнить поиск по пробелу в списке слов:
Если фразовая конструкция была распознана некорректно, разбейте её на отдельные слова:
Если слово входит в фразу, а вы хотите посмотреть перевод именно отдельного слова, нажмите на нужное слово, удерживая клавишу Alt.
Скоро мы добавим больше (много больше) фразовых глаголов, чем есть сейчас. Можете также нам написать, если какие-то неверно переводящиеся идиоматические конструкции вам особенно надоели - постараемся их распознать.
P. S. Всем, кто просит транскрипции: будут на следующей неделе.
Новые способы оплаты
Ранее мы анонсировали оплату банковскими картами.
Теперь мы принимаем многие другие виды платежей: электронные деньги (Яндекс.Деньги, Webmoney, Qiwi и др.), оплату через интернет-банки и телефоны (пока только Мегафон, остальные операторы будут позже).
Все способы оплаты доступны на странице wordsfromtext.com/payment/
Англо-английские переводы
Мы добавили на сайт англо-английские переводы. Источник — Wordnet (wordnet.princeton.edu).
Нажмите на слово — и сможете посмотреть словарную статью:
Значения отсортированы по частоте использования (согласно корпусу текстов Ворднета). По умолчанию показаны значения, использующиеся в 10% случаев и более. Остальные скрываются под кнопкой "показать ещё".
Отдельно включаются примеры из Ворднета:
Галочка помнит своё положение: если вам нравится смотреть статьи с примерами, достаточно нажать её один раз.
Словарные статьи из Ворднета есть теперь и в версии для печати:
Печатная версия имеет множество настроек: можно отключать второстепенные значения, отключать примеры, печатать в 2 колонки (экономит бумагу) и проч.
Примеры напечатанных слов (pdf):
Табличкой: wordsfromtext.com/samples/print-table.pdf
Полные статьи из Ворднета: wordsfromtext.com/samples/print-wordnet.pdf
Чередуйте чтение с изучением слов
Теперь статистика слов может считаться не только для всего текста, но и постранично:
Мы предлагаем использовать эту возможность, чтобы более эффективно пополнять словарный запас.
При чтении текста теперь будут появляться кнопки, которые предложат вам просмотреть слова с ближайших страниц перед чтением этих страниц...
...и после:
Количество страниц, через которое вам предлагается переходить к словам, регулируется в панели «Настройка отображения» (для каждого текста оно индивидуально):
Число страниц по умолчанию для новых текстов задаётся в настройках сайта: wordsfromtext.com/settings/
Конечно, вам надо самому решить, когда вы будете просматривать и учить слова — до чтения, после, в обоих случаях или никогда. Здесь каждому надо найти свой оптимальный способ запоминания.
Субтитры с переводами
Мы добавили возможность скачивать субтитры с персональными переводами (разумеется, переводятся только незнакомые вам слова).
На странице чтения текста теперь появляется такое окошко:
Галочка отвечает за выделение новых слов и слов к изучению зелёным и жёлтым цветами (так переводы не сливаются с основным английским текстом).
А вот так это выглядит в проигрывателях:
Разумеется, подобные переводы не научат вас многому, если вы будете бегло читать русский текст. Поэтому не ленитесь останавливать время от времени проигрыватель, чтобы внимательно прочитать неизвестное слово.
Если у вас будут проблемы с воспроизведением наших субтитров в каком-то плейере, напишите нам во Вконтакте (vk.com/wordsfromtext) или на почту (info@wordsfromtext.com).
Пишите также о своих впечатлениях и идеях, как можно улучшить работу с видео-форматом.
Оплата на сайте
Сегодня мы ввели оплату на сайте.
Что это означает?
Часть возможностей сайта теперь доступна только при наличии «аккаунта с полным доступом». Всем пользователям, и старым и новым, доступен 1-месячный пробный период, в течение которого можно использовать все возможности сайта. Вы можете либо его активировать, либо сразу оплатить использование сайта — в последнем случае пробный период может быть использован позднее.
Можно работать и без полного доступа ко всем возможностям сайта (т. е. ничего не оплачивая и даже не подключая пробный период). В этом случае вам не будут доступны следующие возможности:
— Чтение текстов с переводом незнакомых слов.
— Экспорт слов для изучения в Anki, Memrise и т. д.
— Контекст (примеры предложений в списке слов из текста).
— Смена части речи и леммы.
— Игнорирование слов.
Т. е., по сути, останутся возможности нашего старого сайта
2011–2014 года + личный словарь.
Оплата следующая:
3 месяца полного доступа — 320 руб.
1 месяц полного доступа — 160 руб.
В количество чашек кофе переведите сами :-)
Оплата будет идти на развитие сайта.
Ну а за ближайший месяц мы сделаем, как минимум,
следующее:
— Внедрим англо-английский словарь.
— Вернём англо-русский словарь.
— Добавим транскрипции.
— Сделаем сервис чтения текстов ещё в 2 раза(*) удобнее и
полезнее.
— Сильно улучшим работу с субтитрами.
(*) — ну, если не в 2, то в 1,85 точно.
Подробнее об оплате: wordsfromtext.com/payment/