Am Fri, 2 Jan 2009 03:11:45 +0100 schrieb Jörn Eisner:
Jörn,
Post by Jörn EisnerHallo!
Hier soll ein altes Buch (1600 Seiten) in Kleinstauflage neu gedruckt
werden. Neusatz lohnt nicht, daher sollen allen Seite eingescannt
werden.
- Reichen 300 dpi? Sollten ja eigentlich.
Das kann Dir doch hier eigentlich keiner beantworten, denn die
Scanauflösung sagt doch nur etwas über die Scanqualität aus.
Eine entscheidende Rolle spielt doch wohl auch die Qualität der Vorlage.
Ich habe wenig Ahnung von Bildverarbeitung, aber könnte eine hohe Auflösung
vielleicht nicht sogar schädlich sein?
Ich denke, Du solltest das einfach mal ausprobieren, such Dir einige
möglichst kritische Seiten aus, scanne Sie in verschiedenen Auflösungen
schaue Dir das Ergebnis an.
Bei meiner Arbeit mit OCR-Programmen war das Ergebnis mit Graustufenscans
generell besser, als mit reinen Schwarzweißscans.
Für OCR (falls das überhaupt in Frage käme), sollten es schon 600
dpi sein.
Post by Jörn Eisner- Jede 300 dpi eingescannte Seite ist reichlich groß. Das mal 1600
ergibt ja eine gigantische Datei. Kann das eine Druckerei handhaben.
oder besser in mehreren kleineren Dateien abgeben?
Na ja, ich denke, dass es nicht unbedingt eine Datei sein müsste, oder?
Post by Jörn Eisner- Sollte man die Seiten (eigentlich 300-dpi-Bilder) in ein
InDesign-Dokument einfügen und das Ganze dann als PDF ausgeben?
Ich habe keine Ahnung, ob InDesign das richtige Programm für so etwas wäre.
Kann man in InDesign 1600 Bilder automatisch positionieren?
Für Ventura Publisher könnte ich mir so etwas durchaus vorstellen. Es
könnte vielleicht sogar Sinn machen, die Bilder zu beschneiden (Ränder) und
Seitenzahlen und ähnliches neu erzeugen zu lassen.
Die resultierende Datei (nicht komprimiert) wäre sicher um einiges kleiner.
Post by Jörn EisnerVielleicht hat jemand schon mal sowas in Angriff genommen. Bislang habe
ich alles "richtig" gesetzt und per PDF an die Druckerei geliefert und
kein quasi "Facsimile" angefertigt. :-)
Jörn
Ulf hat Dir ja die OCR-Lösung vorgeschlagen, die aber in Deinem Fall
sicherlich nur in Frage kommt, wenn die reine Scanlösung kein ausreichendes
Ergebnis ergibt.
Ralfs Einwand der Nacharbeit ist sicherlich nur eingeschränkt richtig.
Keine Frage, Nacharbeit _ist_ notwendig, der Umfang hängt jedoch wieder
entscheidendend von der Art der Vorlage und der _Art_ der Nacharbeit ab.
Bei der Vorlage sind aber andere Dinge wichtig, als bei der reinen
Scanlösung.
Ein guter Scan erhöht ohne Frage die Erkennungsrate, der Inhalt bestimmt
aber entscheidend die Qualtiät des Endergebnisses.
Ohne hier auf alle Einzelheiten eingehen zu wollen:
Überschrifterkennung
Absatzerkennung:
Zusätzlicher Abstand, Erstzeileneinzug, Blocksatz/Flattersatz
Rückgängig machen von Trennungen
Lesefehlererkennung
Zur Verfügung stehende Wörterbücher
Korrekturverfahren, zum Beispiel bei Tabellen, Rechnungen usw.
...
Wirklich befriedigende Ergebnisse bekommt man sicherlich nur, wenn man
solche Arbeiten regelmäßig macht.
In _manchen_ Fällen kann das Ergebnis eine fertige DTP-Datei ergeben.
;-)
In einigen Fällen haben mich die Fehler bei der Ersterfassung mehr
beschäftigt, als die eigenlichen Lesefehler.
Die intelligente automatische Prüfung von Texten bringt so manchen nicht
erkannten Fehler hervor.
Wirklich schwierig sind Texte, die sich mit Rechtschreibefehlern und den
Möglichkeiten der OCR-Erkennung befassen.
einen schönen Tag wünscht
Werner
--
Werner Perplies, www.weepee.eu
Wps RegEx
Kostenloses Programm zum lokalen Testen und Verwalten von Regulären
Ausdrücken
http://www.weepee.de/de/wps_regex/wps_regex.html