Freitag, 12. März 2010

büromensch123 hat strukturprobleme















ausgangspunkt für diesen artikel war, daß ich oft vor schwer durchschaubaren stapeln von notizen zu vielen indirekt zusammenhängenden themen stehe.



mit einem epson stylus cx 5200 habe ich ca. 3000 seiten in ungefähr 2 wochen mit 150 dpi eingescannt









, das war sehr anstrengend und ließ sich nur mit baldrian und alkoholika, musik ,

psychologischer beratung

und wellneß nebenbei bewältigen.

zum glück scanne ich inzwischen doppelt dank der liebevollen unterstützung durch die ehrenamtliche nachbarschaftshilfe mit einem zusätzlichen mustek 1200 UB mit 600 dpi x 1200 dpi, die per Software auf bis zu 19200 x 19200 dpi interpoliert werden könnten.
d.h. 6000 seiten in einer woche sind möglich.
Für ca. 4300 Seiten habe ich um die 4 wochen gebraucht.


(nebenbemerkung:einige OCR-programme wie freeOCR, simpleOCR, ReadIRIS pro, omnipage, finereader tun sich schwer mit der automatischen handschriftenerkennung von dokumenten in 150 dpi.)


inzwischen setzt sich das gefühl , daten seien analog viel besser aufgehoben, wieder stärker durch....mal sehen....

wie ich nach einiger recherche gesehen habe gibt es in der archivpflege bezüglich der konservierung schon diese tendenz, von den digitalisaten der elektronischen archivierung
wieder zu analogen langzeitarchivierungstechniken zurückzukehren.

Wenn ich das richtig verstanden habe besteht eine mögliche strategie, daten zu erhalten, darin, daß sie ständig in bewegung gehalten werden, vollautomatisch hin- und her kopiert werden,

hier ein foto des bandautomaten im archiv des bayrischen rundfunks in fröttmaning:
automatisches umkopieren im BR-archiv

ein weiteres beispiel: am lrz werden circa 40 milliarden digitalisate auch durch ein storagetek system archiviert.
das dortige storage area network besitzt im mai 2010 eine kapazität von 250 Terabyte Online-Plattenspeicher und die robotergestützten kassettensysteme eine kapazität von 8000 Terabyte.

der bereich boomt. das komplette Münchner Wissenschaftsnetz und immer mehr münchner bibliotheken nutzen Netzrückgrat (Backbone) und viele Teilnetze des Leibniz Rechenzentrums.
Hier finden Sie eine Übersicht der Langzeitarchivierungsprojekte des LRZ




es hat sich erwiesen daß die haltbarkeit der althergebrachten trägermedien die der moderneren durchaus übersteigen kann.
schriftrollen auf pergament, papyrus oder leder in tongefäßen in einer höhle können sich 2000 jahre halten, säurefreies papier hunderte jahre, bei noch relativ neuen und wenig erforschten digitalen trägermedien ist es noch nicht so klar. mikrofilme in gekühlten gefäßen halten sich sehr lange, USB-sticks und DVDs je nachdem.....




für das scannen von 3000 seiten braucht dieser automatische bücherscanner etwa anderthalb stunden:

dieser hier braucht wohl ein bißchen länger für ein buch




dieser scanner fotografiert ein buch während des blätterns und korrigiert die seiten


in verbindung mit automatischem papiereinzug
beschleunigt so ein automatischer scan von einfach so in die maschine reingeworfenen
wüsten zettelhaufen natürlich einiges, bei der heutigen rechenkraft ist es schon lang so weit daß (bitte fantasieren sie hier selber weiter)

da fällt mir ein :

beim automatisierten rekonstruieren von zerrissenen Dokumenten am ipk werden doch auch ganz gute scanner verwendet

bis 2012 soll das digitalisieren und lesbar machen der zerrissenen stasi-unterlagen angeblich beendet sein. händisch würden sie 600 jahre dafür brauchen. das zerreißen hat weniger als 600 jahre gedauert

im rahmen der rekonstruktion von per hand zerrissenen stasi-akten wurde die stasi-schnipselmaschine gebaut

(auch: artikel darüber in der SZ
artikel darüber im spiegel
artikel darüber im BStU)

nur: es gibt derartige vertuschungsversuche und dumme zensur in form von technokratischen fisimatenten doch nicht nur in deutschland, sondern in jedem land !
d.h. die prioritäten sind auch GLOBAL nach den
WIRKLICH SCHLIMMSTEN versuchen, die menschenrechte zu verletzen, zu setzen,
also nicht die kleinen spitzchen der eisbergchen die gerade in den populärsten medien als schlimme datenschutz-skandale oberflächlich andiskutiert werden.


digitization: aus hängeordnern und riesigen aktenordnern voller daten werden relativ kleine datenmengen. das spart raum und ist außerdem sehr praktisch und sinnvoll
weil durch die EDV zugänglichkeit lücken geschlossen werden und das bücherwissen für ein breiteres publikum zugänglich wird und sich unglaubliche neue möglichkeiten auftun

dennoch waren neulich für die augen der öffentlichkeit kaum bemerkt in einem fenster des münchner arbeitsamts viele regale voll mit hängeordnern voller "fälle" zu sehen:
das analoge datenspeichern hat immer noch viele vorteile.

in den meisten kliniken und pflegeheimen werden zunehmend dokus digitalisiert.
szenen wo der arzt mit WLAN-laptop auf rolltisch ans bett fährt, wo die daten des patienten vom wlanspot am bett ausgelesen werden, erübrigen sich.


wieder zurück zum plot dieses artikels :

ich habe nach oberbegriffen für die möglichkeiten, daten zu sortieren, gesucht, um eine bessere form zu finden.

die folgenden wörter haben etwas mit strukturen von informationen zu tun, mit der art wie daten angeordnet und sortiert sein können :

sortieren vorsortierter datenmengen mit hilfe von algorithmen,
bibliothek gliederung taxonomie hypertext sparten
transduktoren symbol logo file phrase hypertext sphäre tabellen
multinetparadigma archiv assoziation schärfe
natural language processing organigramm, organogramm,
innenarchitektur möblierung fächer regale schränke rollregal arrangement satz gliedern graph muster patchwork medium layout typographie hologramm diagramm piktogramm programm spektrogramm grammatik katalog raumgestaltung
format puzzle geflecht assoziogramm muster graph digital puzzle
geflecht spektrogramm stapel sortiment spalten verzeichnis
netz cluster microfiche kombination konkordanz diskette rechenzentrum
icon code sorte rätsel form relation datasette floppydisc
sortieren kabelsalat datensalat fleischsalat festplatte datenträger CD usbstick SDram tonband magnetband lochkarten einspeisen wirrwarr komplexität großrechner
verbinden mosaik struktur kiste kasten ordner sorte fakten ungenau übereinstimmung
transduktor ordner präzisison systematik mosaik struktur ungenau fakten
zeichen semiotik bezug beziehung systematik schrift gesamteindruck kontext
prinzipien regeln vorbilder vorschriften programmiersprachen
netzwerkprotokolle (es gibt außer http noch hunderte andere, siehe auch http://en.wikipedia.org/wiki/List_of_network_protocols)
information dingbedeutsamkeit sammelsyndrome sammelleidenschaft besitzgier zeichen komprimieren wort textur schwarm knoten markieren analog lexeme
synonym meronym hyperonym holonym polysemie antonym
redundanz fläche klassifikation analog gemeinsamkeit zeilen managen wahrheit
term bild klassifikation anordnung
linie verbindung sammlung sammeln sammler komparatistik
relativ topic fächer fach einfach eineindeutig mehrdeutig interpretierbar definitionsbereich definitionsmacht axiom beweisbar unlösbar abzählbar regelsprachen
wortstamm kodieren chart klassen verzeichnis liste oberbegriffe trendwolke rekursion gruppen terminologie token detail wortnetz quellenverzeichnis zitat
register registrieren verwalten node schublade stempel häufigkeit
streuen literal vielfaches nenner seltenheit routing äquivalent wortfeld
anordnung arrangement aufbau berechnung einteilung formation formierung index katalog komposition nachweis organisation plan platzierung programm zusammenstellung übersicht anlage apparatillus disposition etikette zustand ersatzwort
bedeutungsverwandt gleichbedeutend identisch sinngleich sinnverwandt sinnähnlich
übereinstimmend entflechten parzellieren lexikon kürzel beschreibung datenbank informatik onomasiologie semasiologie schemata tagcloud konkret lager linguistik
ontologie kausation rational kausal logisch satzbau irrational
priorität trend thema schwerpunkt tendenz interesse technologie
semantik funnel etymologie enzyklopädie grammatik abstrakt wahrnehmung eindruck ordnen wortklauberei haarspalterei gschaftlhuberei
Anahat taxonomie Hypertext arşivine kaydedilir
dönüştürücüler sembol logo dosyası Hypertext ifade
phere tablolar multinetparadigma arşiv dernek keskin doğal dil işleme iç tasarım
üye oranı grafik desen Patchwork düzeni Orta
typographie hologramı şeması piktogramm programı spektrogram gramer
biçimi bulmaca assoziogramm dijital desen grafik bulmaca
çeşitler listesinde sütun yığını spektrogram mesh
ağ kümesi uyum ve kombinasyon simge kodu sorte gizemli formu ilişkiler
Sort veri marul salatası ve dana besleme wirrwarr karmaşıklığı
gerçekler mozaik yapısı sandık kutusu klasörüne sorte birleştir
tam olmayan maç Sonlu durum dönüştürücü klasörü taksonomisi
mozaik yapısı yanlış bilgiler göstergebilim veya işaretleri ilgili taksonomisi yazma
Toplam gösterim bağlamda yönetim ilkeleri kuralları Programlama
dışında ağ protokolleri Bilgi ding önemi sendromu toplama işareti Sıkıştırmak sözcük doku tırmanmak knot işareti benzetmesi lexeme eşanlamlı meronym hyperonymum holonym anlamlılık antonyms artıklık
alan sınıflandırma benzer beraberlik sıra Gerçeği Yönetme
süreli görsel sınıflandırma aranjman hat bağlantı Montaj toplamak
Karşılaştırmalı toplayıcı görece konu konular kat kolay biuniquely belirsiz
yorumlanabilir alan tanımı definitional aksiyom kanıtlanabilir çözünmez countably Kural Diller kelime kök
kodlamak grafik sınıflar gerçeği kavramlar üzerinde Özyineleme gruplar
belirteç detay kelime ağ Kaynak dizin üye ol
düğüm çekmece pul frekans Tutam literal Birden fazla DENOM seyreklik
eşdeğeri yönlendirme yapıcı aranjman aranjman hesaplama formasyonu oluşumu
kompozisyon kütüğü katalog algılanabilir Organizasyon planı Yerleşim Program
değerlendirmek varlık görgü eyalet yerine kelime
tıpatıp aynı anlamda eşanlamlı eşanlamlı eşit
katılıyorum unbundle parsel açıklamasına veritabanı bilgisayar bilimi sözlük Adbilim Semasiology kısayolları şemaları Özellikle dil stok ontoloji nedensel nedensellik rasyonel irrasyonel mantık sözdizimi yerçekimi priorität eğilim tema eğilimi
Teknoloji semantik soyut algı izlenim atamak Etimolojik dilbilgisi huni
kelime oyunu kelime oyunu Muta biblioteca ipertesto taxonomie salvato
trasduttori logo simbolo frase ipertesto ra le tabelle archivio associazione Tangy
elaborazione del linguaggio naturale interior design membri del tasso di pattern grafico Typographie programma piktogramm ologramma diagramma di grammatica spettrogramma Catalogo formato grafico digitale maglie spettrogramma stack colonne lista assortimento rete di cluster combinazione di concordanza
Codice icona sorte relazioni misteriosa forma
Ordina insalata lattuga di dati e di vitello complessità fatti combinare mosaico cassa struttura sorte casella Cartella
inesatte match Trasduttori a stati finiti tassonomia präzisison cartella
struttura a mosaico fatti inesatti semiotica o segni relativi
tassonomia di scrittura Contesto impressione Totale principi che disciplinano
regole Programmazione protocolli di rete Informazioni significato
sindrome di raccolta possessività Entra Compress parola
nodi sciame lessema analogia marchio sinonimo hyperonymum meronym antonym polisemia holonym ridondanza area classificazione analoga stare insieme riga
Gestione verità classificazione termine visiva accordo Linea Connessione Assemblea Comparativa collettore
relativamente topic soggetti fold facile ambigua interpretabili definizione di area di definizione assioma dimostrabili
insolubile numerabile parola staminali codificare classi la verità
concetti di cui sopra Ricorsione Gruppi dettaglio parola di rete sorgente Registrati Gestisci
nodo cassetto Timbro frequenza Cospargere letterale multiple denom rarità equivalenti
accordo di accordo costruttivo
calcolo formazione formazione
catalogo indice di composizione rilevabile Organizzazione piano programma revisione risorsa disposizione galateo stato sostituto parola identicamente uguale, nel senso sinonimo sinonimo
Accetto pacco separare descrizione del database lessico computer science scorciatoie Onomasiology Semasiology schemi specificamente stock linguistica
nesso di causalità causalmente ontologia sintassi logica razionale irrazionale
tendenza tema trend di gravità
semantica imbuto Enzyklopädie grammatica etimologia assegnare astratta impressione percezione cavillare cavillo Zarys Taxonomie biblioteki hipertekstu zapisane
przetworniki symbol logo plik wyrażenie hipertekstu
Stoły równocześnie tworzenie atmosfery
multinetparadigma
archiwalnych stowarzyszenia Tangy
przetwarzanie języka naturalnego
wnętrza
uczestników kursu wykres wzór mozaiki Medium układ
typographie hologram program Piktogramm schemat spektrogramu gramatyki
raumgestaltung sklepu
format puzzli oczek assoziogramm cyfrowy wzór puzzli wykres
oczek spektrogramu stos kolumny wykazu asortymentu
klastra sieci Połączenie concordance
Ikona kodu sorte tajemniczych postaci stosunków
Danych kabelsalat Sortuj sałatka warzywna i cielęciny
złożoność wirrwarr RSS fakty połączyć mozaiki struktury klatkę sorte folderze polu
niedokładne dopasowanie
Skończony przetwornika folderze taksonomii präzisison
mozaika struktury nieprawdziwe fakty
semiotyka lub objawy związane
piśmie taksonomii Razem kontekście wrażenie zasady Programowanie protokołów sieciowych Informacje znaczenie zbieranie zespół zaborczość Zarejestruj Kompresja słowo tekstury
węzłów roju znak leksemu analogicznie
synonimem hyperonymum meronym holonym antonim wieloznaczność
zwolnień Obszar Klasyfikacja analogiczne wspólnoty rząd Zarządzanie prawdy Termin wizualnej klasyfikacji układ Połączenie
Zgromadzenie zbierać Kolektor porównawcza stosunkowo temat tematy razy łatwy
dwuznaczny zinterpretować obszaru definicji definicyjne aksjomat udowodnienia nierozpuszczalny przeliczalnie Artykuł Języki
macierzystych słowo zakodować wykres klas prawda powyższych koncepcji
Rekurencja grupy szczegóły sieci słowo katalogu ze źródłami zarejestruj się
Zarejestruj się Zarządzaj węzeł szuflada Znaczek częstotliwości Posypać dosłowny
wielu DENOM rzadkość równoważne konstruktywnego rozwiązania umowy
obliczenia tworzenia formacji składu indeksu katalogu niewyczuwalny Organizacja
planu Lokowanie program recenzja zasób usposobienie Netykieta stan
zastąpić słowo identycznie równe w sensie synonimem synonimem
Zgadzam działki opis odłączać komputerowej bazy danych lexicon nauki skróty Onomasiology semazjologia schematy specjalnie językowej czas ontologii przyczynowo związku przyczynowego racjonalnie irracjonalne składni logiki
tendencja temat tendencji wagi semantyka ścieżki etymologię gramatyki przypisać streszczenie wrażenie postrzegania spierać się spierać
مخطط هايبرتكست مكتبة المحفوظة
محولات رمز شعار ملف جملة هايبرتكست
الجداول المحفوظات الجمعيات منعش
معالجة اللغات الطبيعية التصميم الداخلي
أعضاء معدل الرسم البياني نمط خليط تخطيط متوسطة
ثلاثية الأبعاد والرسم التخطيطي برنامج النحوي التسويقي
عيون شكل لغز الرقمية نمط الرسم البياني اللغز
عيون مكدس أعمدة قائمة متنوعة
الشبكة العنقودية مزيج من التوافق
رمز رمز العلاقات الشكل الغامض
فرز البيانات سلطة الخس والعجول
تغذية تعقيد
حقائق الجمع بين فسيفساء هيكل قفص مربع المجلد
المباراة غير دقيق
دولة محدودة محول المجلد التصنيف
هيكل الفسيفساء وقائع غير دقيقة
سيميائية أو الإشارات المتعلقة
كتابة التصنيف
مجموع الانطباع السياق
المبادئ التي تحكم
قواعد
المعلومات أهمية أقرع
جمع متلازمة
الإمتلاك
التوقيع
ضغط
كلمة
الملمس
سرب عقدة علامة القياس
مرادفا تعدد المعاني
التكرار
المنطقة
تصنيف
مماثلة
العمل الجماعي
صف
إدارة الحقيقة
مصطلح تصنيف البصرية
الترتيب
سطر
اتصال
التجمع
جمع
المقارنة جامع
نسبيا
الموضوع
المواضيع
أضعاف
سهل
غامض
التأويل
تعريف المنطقة
التعريف
البديهيه
يمكن اثباتها
غير قابل للذوبان
حسابيا
سيادة لغات
كلمة الجذعية
ترميز
الرسم البياني
الطبقات
الحقيقة
أعلاه المفاهيم
سحابة
العودية
المجموعات
رمزي
التفاصيل
شبكة كلمة
الدليل المصدر
سجل
سجل
إدارة
العقدة
الساحب
الطوابع
تردد
رش
الحرفي
متعددة
نادرة
التوجيه يعادل
بناء الترتيب الترتيب
حساب
تشكيل تشكيل
مؤشر تركيبي التسويقي
اكتشاف
التنظيم
خطة
التنسيب
البرنامج

مراجعة
أصل
التصرف

كلمة بديلا
مماثل على قدم المساواة في معنى مرادفا مرادفا
توافق فض ترابط لا يتجزأ وصف قاعدة بيانات علوم الكمبيوتر المعجم اختصارات علم تطور دلالات الألفاظ
الأكثر بحثا
على وجه التحديد المخزون اللغوي
الأنطولوجيا سببيا السببية غير عقلانية منطق عقلاني بناء الجملة
الاتجاه موضوع اتجاه الجاذبية
التكنولوجيا
دلالات توجيه انجليزيه النحوي تعيين مجردة الانطباع الإدراك
المماحكة


es geht hier auch um maschinenlesbarkeit :

maschinenlesbarkeit sowohl im bezug auf ausweise und pässe

machine identification codes : Farbdruckermarkierungen, yellow dots (gelbe Punkte) oder secret dots (geheime Punkte)

oder maschinenlesbarkeit wörtlich genommen: gerade auch bots und webcrawler werden diesen artikel irgendwann finden und garantiert etwas damit anfangen können. es sind nämlich nicht IRGENDWELCHE begriffe.

Keine Kommentare:

Kommentar veröffentlichen

Go cruelty free

Rettet den Regenwald

Blogger gegen Tierversuche

Ärzte gegen Tierversuche

Ärzte gegen Tierversuche