сканирование книг
Оцифровка книжек — это самая процесс перевода картонных книжек в электрический (числовой) разряд. Электрические копии книжек имеют все шансы организовывать электрические библиотеки и распространяться в Козни. Цифровые книжки разрешено просто расширять, воссоздавать и декламировать на экране. Традиционно, оцифрованные книжки берегут в форматах: Portable Document Format (PDF), DjVu, JPG либо TIFF. Для преображенья начального изображения употребляют оптическое определение знаков (OCR), оно нужно для подключения страничек книжки в числовой формат, таковой как ASCII либо иной схожий, а еще для работы с словом и иными объектами, к примеру, в Microsoft Word.
Сканирование изображений имеет возможность проистекать вручную либо автоматом. В обыденных сканерах книжка размещается на стекле, на книжку падает свет, и зрительный устройство сканирует книжку, двигаясь перед стеклом. Остальные букинистические сканеры употребляют V-образную раму и снимают странички поверх. Странички имеют все шансы переворачиваться вручную либо с подмогою самодействующих приборов подачи бумаги. Особое мощное стеклышко, как управляло, придавливает странички, чтоб портить недочеты сканирования. Опосля сканирования програмка корректирует проявление акта, выпрямляя его, отрезая, редактируя и преобразовывая его в контент, и конечную форму электронной книжки. Проводят проверку отсканированное подражание на присутствие погрешностей люди.
Сканирование 118 точек/см (300 точек на дюйм) считается нормой для преображения в числовой разряд слова, но для редкостных и трудных книжек нужно внедрение наиболее высочайшего разрешения. Сверхтехнологичные сканеры готовы исследовать возле тыщи страничек в час, эти прибора имеют все шансы заслуживать тыщи баксов.
В прошедшем почаще применялся прирученный комплект слова книжки.
Сейчас процесс оцифровки подключает 2 расклада.
1. Неприменный: приобретение копий страничек в облике графических (традиционно растровых) изображений, исполняемое маршрутом сканирования либо фотографирования с следующей отделкой и сохранением в одном из форматов графических файлов. В данном случае вполне сберегается уникальная вёрстка книжки, и исключаются какие-или оплошности, но неосуществим розыск либо извлечение фрагментов слова для, к примеру, целей цитирования.
2. Опциональный: определение слова (разработка «оптического определения знаков» — OCR) с следующим сохранением распознанного слова в одном из форматов электрических книжек. В данном случае делается вероятен полнотекстовый розыск сообразно книжке и индексация огромных массивов электрических книжек, но затрудняется воссоздание уникальной вёрстки, изображений, схем и формул, фактически неминуемы стают оплошности определения.Оцифровка книжек — это самая процесс перевода картонных книжек в электрический (числовой) разряд. Электрические копии книжек имеют все шансы организовывать электрические библиотеки и распространяться в Козни. Цифровые книжки разрешено просто расширять, воссоздавать и декламировать на экране. Традиционно, оцифрованные книжки берегут в форматах: Portable Document Format (PDF), DjVu, JPG либо TIFF. Для преображенья начального изображения употребляют оптическое определение знаков (OCR), оно нужно для подключения страничек книжки в числовой формат, таковой как ASCII либо иной схожий, а еще для работы с словом и иными объектами, к примеру, в Microsoft Word.
Сканирование изображений имеет возможность проистекать вручную либо автоматом. В обыденных сканерах книжка размещается на стекле, на книжку падает свет, и зрительный устройство сканирует книжку, двигаясь перед стеклом. Остальные букинистические сканеры употребляют V-образную раму и снимают странички поверх. Странички имеют все шансы переворачиваться вручную либо с подмогою самодействующих приборов подачи бумаги. Особое мощное стеклышко, как управляло, придавливает странички, чтоб портить недочеты сканирования. Опосля сканирования програмка корректирует проявление акта, выпрямляя его, отрезая, редактируя и преобразовывая его в контент, и конечную форму электронной книжки. Проводят проверку отсканированное подражание на присутствие погрешностей люди.
сканирование книг 118 точек/см (300 точек на дюйм) считается нормой для преображения в числовой разряд слова, но для редкостных и трудных книжек нужно внедрение наиболее высочайшего разрешения. Сверхтехнологичные сканеры готовы исследовать возле тыщи страничек в час, эти прибора имеют все шансы заслуживать тыщи баксов.
В прошедшем почаще применялся прирученный комплект слова книжки.
Сейчас процесс оцифровки подключает 2 расклада.
1. Неприменный: приобретение копий страничек в облике графических (традиционно растровых) изображений, исполняемое маршрутом сканирования либо фотографирования с следующей отделкой и сохранением в одном из форматов графических файлов. В данном случае вполне сберегается уникальная вёрстка книжки, и исключаются какие-или оплошности, но неосуществим розыск либо извлечение фрагментов слова для, к примеру, целей цитирования.
2. Опциональный: определение слова (разработка «оптического определения знаков» — OCR) с следующим сохранением распознанного слова в одном из форматов электрических книжек. В данном случае делается вероятен полнотекстовый розыск сообразно книжке и индексация огромных массивов электрических книжек, но затрудняется воссоздание уникальной вёрстки, изображений, схем и формул, фактически неминуемы стают оплошности определения.