Сканирование книг и распознование текста

Компьютеры. программирование, бытовая техника

Модератор: Саша З.

Аватара пользователя
Женя Вайнштейн
Участник форума
Сообщения: 137
Зарегистрирован(а): 29 апр 2002, 23:10

Сканирование книг и распознование текста

Сообщение Женя Вайнштейн » 07 фев 2003, 19:11

Существуют ли сканеры, которые сами листают и сканируют книги? Кто-нибудь сталкивался?

Какие програмы ОСР рекомендуете? Для русского текста - FineReader?

И еще - ни у кого не сочранилось линка на тему где Глебби свои словари для Бабилона и Лингво раздавал?

Zakan
Ветеран мега-форума
Сообщения: 10172
Зарегистрирован(а): 20 дек 2001, 02:00
Откуда: Израиль (Ришон Ле Цион)
Контактная информация:

Сообщение Zakan » 08 фев 2003, 02:42

Подите в архив по страницам, не так давно это обсуждалось, в сентябре-октябре вроде

shadowcaster

Re: Сканирование книг и распознование текста

Сообщение shadowcaster » 08 фев 2003, 19:12

Женя Вайнштейн писал(а):Существуют ли сканеры, которые сами листают и сканируют книги? Кто-нибудь сталкивался?

Этo - дoхлaя зaтея. Кoтoрoй я прoбoвaл бaлoвaться прaктически лет 5 нaзaд. Тoчнее, oнa у меня зaрoдилaсь гoрaздo рaньше - перед oтъездoм - у бaти былa бoльшaя библиoтекa и я ее хoтел oтскaнирoвaть и oтOCRить.
Кoрoче, oтскaнирoвaт oдну чернo-белую книгу берет слишкoм мнoгo времени. С другoй стoрoны, есть мaссa прaктически любoй литерaтуры нa Интернете - местa знaть нaдo.

Аватара пользователя
shperk
Участник со стажем
Сообщения: 248
Зарегистрирован(а): 27 янв 2003, 14:17
Откуда: St-Petersburg, Russia
Контактная информация:

Re: Сканирование книг и распознование текста

Сообщение shperk » 09 фев 2003, 05:44

Женя Вайнштейн писал(а):Существуют ли сканеры, которые сами листают и сканируют книги? Кто-нибудь сталкивался?

Затея, конечно дохлая но попробовать можно. Дело не только в скорости. Очень много книг все же не представоены в И-нете, и, скорее всего, добровольцев не найдется. Мы, к примеру, занялись оцифровкой десткой русско-еврейской литературы периода ее расцвета рубежа 19-20 веков. Пришлось посадить специальную девочку... Действительно, долго, трудоемко - но дело того стоит.
Про сканер - бывают, видел такой в Русском музее. Но, судя по всему, стоит немыслимых бабок. Думаю, если прошерстить сайты производителей, можно найти. (Если денег потом хватит)
Про словари - посмотри в разделе Файлы на http://vlc.pedclub.ru. Раздел доступен только зарегистрированным пользователям - надеюсь, тебя это не остановит :3:
Про OCR программы. По русски действительно - FReader - работает очень хорошо, альтернатив не видно.
А вот с ивритом - засада. Перелопатил пол-интернета, толковой программы не нашел.
Стоит Otiot Trial - оцифровывает так, что, кажется, проще самому набрать.
Другие программы либо не работают без ивритской винды, либо требуют ключикив - а где их взять - может кто поможет?
Во всякой мысли (даже самой глупой, при первом восприятии) есть доля истины и доля заблуждения.
"Новая еврейская школа"!

renreg
Участник форума
Сообщения: 66
Зарегистрирован(а): 20 дек 2001, 02:00
Откуда: Migdal Haemek, Israel
Контактная информация:

Re: Сканирование книг и распознование текста

Сообщение renreg » 09 фев 2003, 08:36

shperk писал(а):

А вот с ивритом - засада. Перелопатил пол-интернета, толковой программы не нашел.
Стоит Otiot Trial - оцифровывает так, что, кажется, проще самому набрать.
Другие программы либо не работают без ивритской винды, либо требуют ключикив - а где их взять - может кто поможет?[/quote]

На мой взгляд, лучшая из плохих - Ligature (она уж лучшн Otiot).
Постучись в ICQ 107089923 поговорим

Kaj
Ветеран мега-форума
Сообщения: 2483
Зарегистрирован(а): 09 янв 2002, 02:00
Откуда: Израиль, Раанана
Контактная информация:

Сообщение Kaj » 09 фев 2003, 11:46

Мы на работе используем OCR в своем продукте. Все проверки показывают, что лучший OCR это FineReader. Для иврита лучше всего Ligature. Но по совему качеству как OCR таковой, она до FineReader сильно не дотягивает. На втором месте после FineReader стоит ScanSoft. Я не знаю, делают ли они системы для конечного юзера, но ихний энжин используют многие производители аппликаций.

Zakan
Ветеран мега-форума
Сообщения: 10172
Зарегистрирован(а): 20 дек 2001, 02:00
Откуда: Израиль (Ришон Ле Цион)
Контактная информация:

Сообщение Zakan » 09 фев 2003, 20:01

Да, я видел такой сканер в одной скоропечатне, он размером, как кровать. И сжатым воздухом шипит, должно листалка такая, что ли.

Для дома и даже маленького оффиса нереально.

Для иврита - берегитесь Отийет - гадость страшная.
Работает предельно плохо.
Поддержки никакой, одно вытягивание денег!
Причем таких, что дешевле руками набирать.

Хороших прог для иврита нету.
Остается ждать, что кто-нить FineReader приспособит...

Да тут уже писали - найдите старую тему

Аватара пользователя
Женя Вайнштейн
Участник форума
Сообщения: 137
Зарегистрирован(а): 29 апр 2002, 23:10

Сообщение Женя Вайнштейн » 10 фев 2003, 20:17

Спасибо!

А из словарей/переводчиков - кто лидирует (ну лень мне тему открывать)? Как я понимаю, спор между Лингво и Вавилоном (для перевода отдельных слов между русским, английским и ивритом из applications вроде ворда или эксплорера), других серьезных претендентов не осталось. Так ли это? А для перевода текста (англ-рус. и наоборот)? Только Сократ? Там еще что-то было, на "С" кажется. Или еще чего изобрели...

Аватара пользователя
shperk
Участник со стажем
Сообщения: 248
Зарегистрирован(а): 27 янв 2003, 14:17
Откуда: St-Petersburg, Russia
Контактная информация:

два русских гиганта

Сообщение shperk » 11 фев 2003, 05:09

Женя Вайнштейн писал(а): А для перевода текста (англ-рус. и наоборот)? Только Сократ? Там еще что-то было, на "С" кажется. Или еще чего изобрели...

Сейчас в россии известно две программы-переводчика - Сократ и Промт. Что из них лучше, что хуже - Бог весть. Кому-то поп нравится, кому-то попадья...
Промт можно протестировать он-лайн на сайте [url]translate.ru[/url].
Про Сократ не знаю
Во всякой мысли (даже самой глупой, при первом восприятии) есть доля истины и доля заблуждения.

"Новая еврейская школа"!

Прижалов
Участник со стажем
Сообщения: 595
Зарегистрирован(а): 11 дек 2002, 12:33
Откуда: Димона и окрестности.

Re: два русских гиганта

Сообщение Прижалов » 12 фев 2003, 10:47

shperk писал(а):
Женя Вайнштейн писал(а): А для перевода текста (англ-рус. и наоборот)? Только Сократ? Там еще что-то было, на "С" кажется. Или еще чего изобрели...

Сейчас в россии известно две программы-переводчика - Сократ и Промт. Что из них лучше, что хуже - Бог весть. Кому-то поп нравится, кому-то попадья...
Промт можно протестировать он-лайн на сайте [url]translate.ru[/url].
Про Сократ не знаю


Промпт ХР Оффис ничего. Полгода юзаю. Встраивается в Виндовый Оффис, в Эксплорер и сам по себе работает. Перевод - обхохочешся, но лучше все равно не встречал. Знает английский, немецкий и французский.

Аватара пользователя
Женя Вайнштейн
Участник форума
Сообщения: 137
Зарегистрирован(а): 29 апр 2002, 23:10

Сообщение Женя Вайнштейн » 12 фев 2003, 19:15

Промт XT все-таки, наверно, а не ХР?

А обратно, на русский, переводит?

И - точно лучше Сократа?

А еще был Синтаксис (?) или что-то вроде. А может, я и путаю.

Можно его (Промт) выключить, чтоб офис без него загружался (когда он не нужен), и только вызывать, когда надо? Не конфликтует ли его макрос с Лингво 8?

Vorgott
Новый участник
Сообщения: 14
Зарегистрирован(а): 01 ноя 2004, 11:53
Откуда: Haifa

Сообщение Vorgott » 03 ноя 2004, 11:56

Скaнер , кaк oн есть , исклучительнo неудoбен для сдирaния переплетеннoй книги.Для прелистывaния нaдo сoвершaть пoдъем с перевoрoтoм.Нa oдну стрaницу уxoдит дo 30 секунд нaпряженнoй рaбoты. Мoжет, ктo прoбoвaл грaбить цифрoвикoм нa шaтиве нaд рaспaxнутoй книгoй? Кстaти, первые версии ксерoксoв требoвaли 11-ти ручныx oперaций. A теперь - всё делaет нaxитрaя листoпрoкaтнaя мaшинкa.

Аватара пользователя
Dark_Divine
Ветеран мега-форума
Сообщения: 5852
Зарегистрирован(а): 20 июл 2003, 18:15
Откуда: Израильская ССР

Сообщение Dark_Divine » 03 ноя 2004, 17:15

Для иврита ещё есть IRIS. Не очень старая версия лежит в Осле.

Аватара пользователя
Борис Бердичевский
Ветеран интернета
Сообщения: 29353
Зарегистрирован(а): 17 ноя 2001, 02:00
Откуда: Израиль, Беэр-Шева, которой ~3700 лет
Контактная информация:

Сообщение Борис Бердичевский » 08 ноя 2004, 09:46

Ничего лучше переворачивания книги ручками, увы, не придумаешь.
Конечно, сканер должен быть формата A3 (а не A4), иначе некоторые книги не поместятся в развороте. К тому же на такой сканер можно положить 2 книги сразу (вот правда время сканирования возрастает).
Меня зовут Барух Борис. Ани маамин бэ эмуна шлема...
Про «палестинцев»: «Они ревность Мою вызывали небогом... Я в них ревность вызову ненародом»
Мы -- здесь, они -- там! Мы здесь, в Израиле, они там, в арабских странах! | http://www.borisba.com

Аватара пользователя
Сашура
Ветеран мега-форума
Сообщения: 2020
Зарегистрирован(а): 14 янв 2002, 02:00
Откуда: Петах Тиква
Контактная информация:

Сообщение Сашура » 12 ноя 2004, 23:10

На сканирование в pdf формат дорожного атласа, я затратил 3 месяца :27:
мозоли натер на всех местах :ic1:
Сейчас идет процесс наполнения линками. :44:


Вернуться в «Наука и техника»




  Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 48 гостей