Saving
Новости

На vk.com мы дублируем
важные новости


Старый сайт перестаёт работать

1 июля 2015

Наш старый сайт old.wordsfromtext.com в самое ближайшее время перестаёт работать.

Он хорошо послужил в течение трёх лет, обслужив в общей сложности около 10000 пользователей. После перехода на новую версию сайта он был оставлен, чтобы сделать переход безболезненным и плавным.

Мы приняли решение в ближайшие дни переехать на другой, более мощный сервер. Это позволит на порядок быстрее делать обработку текстов, особенно мелких. Перевозить старый сайт затратно и, в общем-то, непонятно зачем: на старом сайте давно не обновляется словарь, гораздо хуже работает распознавание слов. Поэтому мы его выключаем.

Всё, что было доступно на старом сайте, бесплатно доступно и на новом, без ограничений по времени.

Все тексты со старого сайта, которых пока нет на новом, будут перенесены. (UPD. уже перенесены.)

Если у кого-то есть трудности с новой версией сайта, и поэтому вы пользуетесь старой, не стесняйтесь нам написать во ВКонтакте или на info@wordsfromtext.com, мы с удовольствием разрешим ваши вопросы.

Новые слова и устойчивые выражения

1 июля 2015

Мы обновили словарь сайта.

Во-первых, добавили около 500 устойчивых выражений. Сюда входят обычные англоязычные конструкции (a little bit, instead of, all of a sudden, in spite of, in general), а также заимствованные выражения и термины (vice versa, anno domini, in vitro, con moto и т. д.)

Во-вторых, добавлено около 50000 новых слов, что серьёзно расширяет словарь сайта.

Как эти изменения повлияли на реальные тексты:

"Alice's Adventures in Wonderland"
+ 25 устойчивых выражений
+ 5 новых слов

"Surely You're Joking Mr Feynman"
+ 47 устойчивых выражений
+ 46 новых слов

Устойчивые выражения, распознанные в ваших текстах, вы можете просмотреть в списке слов. Для этого надо установить фильтр "Часть речи" в значение "Фраза".

Также сайт теперь поддерживает загрузку текстов в формате от Амазона azw3.

Статистика и предложения в общем списке слов

31 мая 2015

Ура! В общем списке слов появились предложения из текстов и статистика:

user_sentences.png

Предложения берутся из ваших текстов.

Максимум показываем 3 предложения, предпочтительно из разных текстов.

Для каждого слова показываем число текстов и общее число употреблений.

Данные доступны, в том числе, при печати и в экспорте.

Поскольку данные вычисляются на основе большого количества загруженных вами текстов, операция пересчёта получается весьма затратной. Из-за этого сейчас есть ограничения:

— Функция доступна только для аккаунтов с полным доступом (пробных или платных).
— Полный пересчёт данных происходит раз в сутки (ночью по Москве). Частичный — при добавлении нового текста.
— Числа вычисляются только для слов из вашего словаря (известных и к изучению).
— Предложения вычисляются только для слов к изучению.
— Пересчёт производится максимум для 500 текстов с наиболее поздним временем последнего доступа (не такое сильное ограничение, рекордсмены сейчас имеют 300).

Думаю, позже мы переработаем планировщик задач, и тогда данные будут пересчитываться гораздо чаще, чем раз в сутки. Но пока — так.

Пара вопросов для понимания аудитории (ответить можно здесь: vk.com/wordsfromtext или на info@wordsfromtext.com).

— Нужна ли вам статистика по новым словам (скажем, топ 1000)?
— Нужно ли вам более 3 предложений?
— Действительно ли, как мы думаем, никому не нужны предложения-примеры в известных словах?
— Что ещё нужно доработать в этой общей статистике?

Улучшение списка текстов

13 мая 2015

Мы переделали страницу со списком текстов, улучшив её практически во всём:

texts.png

В списке текстов показана раскладка слов по статусам (новые / к изучению / известные).

Индикатор под текстом помогает понять, какую часть книги вы прочитали.

Добавлен поиск, ищет тексты по заголовкам.

Тексты по умолчанию сортируются по «времени последнего доступа». Это время обновляется при переходе между страницами или при смене статуса слова. Фича доступна только в списке ваших текстов.

Сортировка по времени добавления текста тоже осталась.

По нажатию на «инфо» можно посмотреть подробную статистику по тексту:

texts-text-info.png

Сбой и продление аккаунтов

1 мая 2015

Вчера (30 апреля) на сайте был 4-часовой сбой, в результате которого не работало отображение переводов.

Причиной явились незапланированные работы хостера, после которых часть наших сервисов не восстановили нормальную работу.

В качестве компенсации мы продлили все оплаченные аккаунты на 2 суток и все пробные аккаунты на 1 сутки.

Также рекомендуем перезагрузить тексты, загруженные 30 апреля с 19:00 до 22:20 по Москве. Даже если они загрузились внешне успешно, часть слов могли быть не распознаны.

Приносим свои извинения. Мы написали дополнительные проверочные скрипты, чтобы в дальнейшем минимизировать вероятность подобных сбоев.

Ошибка в обработке файлов

10 апреля 2015

Сегодня днём (10 апреля) пользователи не могли дождаться, пока загруженный текст будет обработан сервером.

Причина была в устаревшей библиотеке для работы с epub-форматом: библиотека не могла обработать некоторые файлы и, в дополнение, не отключалась по таймауту.

Сейчас проблема исправлена. Все файлы, стоящие в очереди, обработаны. Попутно улучшено декодирование epub-формата.

Приносим свои извинения.

Изменения в настройках

26 марта 2015

Мы внесли изменения в настройки.

При чтении «слова к изучению» теперь по умолчанию не переводятся, а подчёркиваются, стимулируя самостоятельно вспоминать перевод:

options-read-mode-demo.png

Разумеется, старый режим можно легко вернуть через панель «Настройка отображения». Также теперь можно отключить переводы — отдельно для «новых слов» и для «слов к изучению»:

options-read-mode.png

Положение галочек в списке слов теперь запоминается:

options-store-words.png

Также появилось управление доступом. Исторически сложилось, что список текстов всех пользователей, а также слова из текстов доступны по прямым ссылкам.

Теперь это можно отключить:

options-access.png

Изменить эту настройку можно по ссылке wordsfromtext.com/settings/#security.

Небольшие улучшения

21 марта 2015

Мы улучшили интерфейс для чтения, а также алгоритм анализа текста.

По интерфейсу — было:

read-paging-old.png

Стало:

read-paging.png

Можно быстро перейти на любую страницу и не бояться, промахнувшись, улететь в конец текста.

Также можно менять размер шрифта при чтении:

read-font-size.png

Улучшено распознавание «множественных» существительных: physics, pants, belongings, maths, и др.

Многие жалуются на то, что «сложные» слова из текста иногда не распознаются. Мы начали работу над этой проблемой. Добавлено распознавание многих иностранных (по отношению к английскому языку) слов. Иногда это редкие слова, а иногда достаточно распространённые. Примеры: status, vacuum, chef, tennis, helluva и т. д. Работу с этом направлении мы ещё продолжим.

Хочется отметить, что ряд слов не распознаётся по задумке. Мы сейчас намеренно опускаем предлоги, вопросительные слова, числительные и некоторые другие части речи. Это значительно снижает шум в списке слов, позволяя отмечать меньше слов как известные. Однако, основываясь на отзывах, мы планируем включить некоторые слова (такие, как since, despite, whose и др.) в список распознаваемых и отмечаемых.

Озвучка и транскрипции

10 марта 2015

Мы добавили транскрипции и озвучку.

При чтении нужно нажать на слово:

pron-read.png

В списке слов произношение надо специально включить:

pron-words-options.png

Затем оно появится под каждым словом:

pron-words.png

«UK» означает, что озвучка сделана человеком из Великобритании (United Kingdom).
«US» — из Америки (USA).

Иногда бывает так, что произношение разных частей речи одного слова различается. Примеры: contract, attribute, construct и др. В таких случаях мы выдаём имеющуюся озвучку для всех вариантов сразу:

pron-nv.png

Решение спорное, но мы решили, что лучше сразу показать все варианты, чтобы было с чем сравнить. И чтобы сразу отложилось отличие.

Все произношения сделаны реальными людьми. Вариантов, сгенерированных автоматически из транскрипций, у нас нет. Качество движков TTS (Text-to-Speech), которые мы смогли найти, нас не устроило.

В итоге озвучку мы брали из открытых источников. Это означает, что какие-то люди (native speakers!) сели, записали и выложили озвучку английских слов. Авторы разрешают использовать своё творение всем, хотя иногда просят указать авторство.

Мы решили давать ссылку на источник везде. Значок © ведёт на страницу, где можно узнать автора озвучки, а также скачать файлы. Мы перераспространяем звуковые файлы под теми же лицензиями, под которыми их получили. Если лицензий было несколько, мы отдаём предпочтение варианту Creative Commons.

Фразы и фразовые глаголы

27 февраля 2015

Сегодня мы научились распознавать фразовые глаголы и другие фразовые конструкции.

Пока возможность запущена в тестовом режиме, и мы распознаём только 22 фразовых глагола (наиболее часто используемых) и 30 фразовых конструкций (of course, on behalf of, with respect to, by means of и т. п.) Фразы будут добавляться, но даже то, что есть, уже значительно сокращает ошибки перевода.

Функционал пока работает только для новых текстов. При чтении выглядит так:

phrases-read.png

Если вы хотите просмотреть список всех распознанных фраз, можно выполнить поиск по пробелу в списке слов:

phrases-list.png

Если фразовая конструкция была распознана некорректно, разбейте её на отдельные слова:

phrases-split.png

Если слово входит в фразу, а вы хотите посмотреть перевод именно отдельного слова, нажмите на нужное слово, удерживая клавишу Alt.

Скоро мы добавим больше (много больше) фразовых глаголов, чем есть сейчас. Можете также нам написать, если какие-то неверно переводящиеся идиоматические конструкции вам особенно надоели - постараемся их распознать.

P. S. Всем, кто просит транскрипции: будут на следующей неделе.

Новые способы оплаты

20 февраля 2015

Ранее мы анонсировали оплату банковскими картами.

Теперь мы принимаем многие другие виды платежей: электронные деньги (Яндекс.Деньги, Webmoney, Qiwi и др.), оплату через интернет-банки и телефоны (пока только Мегафон, остальные операторы будут позже).

Все способы оплаты доступны на странице wordsfromtext.com/payment/

Англо-английские переводы

20 февраля 2015

Мы добавили на сайт англо-английские переводы. Источник — Wordnet (wordnet.princeton.edu).

Нажмите на слово — и сможете посмотреть словарную статью:

wordnet.png

Значения отсортированы по частоте использования (согласно корпусу текстов Ворднета). По умолчанию показаны значения, использующиеся в 10% случаев и более. Остальные скрываются под кнопкой "показать ещё".

Отдельно включаются примеры из Ворднета:

wordnet-examples.png

Галочка помнит своё положение: если вам нравится смотреть статьи с примерами, достаточно нажать её один раз.

Словарные статьи из Ворднета есть теперь и в версии для печати:

wordnet-print-form.png

Печатная версия имеет множество настроек: можно отключать второстепенные значения, отключать примеры, печатать в 2 колонки (экономит бумагу) и проч.

Примеры напечатанных слов (pdf):

Табличкой: wordsfromtext.com/samples/print-table.pdf
Полные статьи из Ворднета: wordsfromtext.com/samples/print-wordnet.pdf

Чередуйте чтение с изучением слов

11 февраля 2015

Теперь статистика слов может считаться не только для всего текста, но и постранично:

words-pages-stat.png

Мы предлагаем использовать эту возможность, чтобы более эффективно пополнять словарный запас.

При чтении текста теперь будут появляться кнопки, которые предложат вам просмотреть слова с ближайших страниц перед чтением этих страниц...

go-to-words-1.png

...и после:

go-to-words-2.png

Количество страниц, через которое вам предлагается переходить к словам, регулируется в панели «Настройка отображения» (для каждого текста оно индивидуально):

read-every.png

Число страниц по умолчанию для новых текстов задаётся в настройках сайта: wordsfromtext.com/settings/

Конечно, вам надо самому решить, когда вы будете просматривать и учить слова — до чтения, после, в обоих случаях или никогда. Здесь каждому надо найти свой оптимальный способ запоминания.

Субтитры с переводами

9 февраля 2015

Мы добавили возможность скачивать субтитры с персональными переводами (разумеется, переводятся только незнакомые вам слова).

На странице чтения текста теперь появляется такое окошко:

srt-panel.png

Галочка отвечает за выделение новых слов и слов к изучению зелёным и жёлтым цветами (так переводы не сливаются с основным английским текстом).

А вот так это выглядит в проигрывателях:

srt-1.jpg

srt-2.jpg

Разумеется, подобные переводы не научат вас многому, если вы будете бегло читать русский текст. Поэтому не ленитесь останавливать время от времени проигрыватель, чтобы внимательно прочитать неизвестное слово.

Если у вас будут проблемы с воспроизведением наших субтитров в каком-то плейере, напишите нам во Вконтакте (vk.com/wordsfromtext) или на почту (info@wordsfromtext.com).

Пишите также о своих впечатлениях и идеях, как можно улучшить работу с видео-форматом.

Оплата на сайте

6 февраля 2015

Сегодня мы ввели оплату на сайте.

Что это означает?

Часть возможностей сайта теперь доступна только при наличии «аккаунта с полным доступом». Всем пользователям, и старым и новым, доступен 1-месячный пробный период, в течение которого можно использовать все возможности сайта. Вы можете либо его активировать, либо сразу оплатить использование сайта — в последнем случае пробный период может быть использован позднее.

Можно работать и без полного доступа ко всем возможностям сайта (т. е. ничего не оплачивая и даже не подключая пробный период). В этом случае вам не будут доступны следующие возможности:

— Чтение текстов с переводом незнакомых слов.
— Экспорт слов для изучения в Anki, Memrise и т. д.
— Контекст (примеры предложений в списке слов из текста).
— Смена части речи и леммы.
— Игнорирование слов.
Т. е., по сути, останутся возможности нашего старого сайта 2011–2014 года + личный словарь.

Оплата следующая:
3 месяца полного доступа — 320 руб.
1 месяц полного доступа — 160 руб.

В количество чашек кофе переведите сами :-)

Оплата будет идти на развитие сайта.

Ну а за ближайший месяц мы сделаем, как минимум, следующее:
— Внедрим англо-английский словарь.
— Вернём англо-русский словарь.
— Добавим транскрипции.
— Сделаем сервис чтения текстов ещё в 2 раза(*) удобнее и полезнее.
— Сильно улучшим работу с субтитрами.

(*) — ну, если не в 2, то в 1,85 точно.

Подробнее об оплате: wordsfromtext.com/payment/

При загрузке данных произошла ошибка. Пожалуйста, проверьте соединение с интернетом и обновите страницу.

У вас недостаточно прав на выполнение операции. Данные не были сохранены.