Vítejte, Host
Uživatelské jméno Heslo: Pamatovat si mne

Téma: Import dat z Clavia - kodování

Import dat z Clavia - kodování 4 roků 6 měsíců zpět #30


  • Příspěvky:3
  • Avatar uživatele ivanovj
  • ivanovj
  • Začátečník
  • OFFLINE
  • Karma: 1
Vzhledem k tomu, že už existuje do VuFindu ILS driver pro Clavius (což je skvělé a díky za to :-)) předpokládám, že někdo tuto kombinaci provozuje. Zajímalo by mě, jakým způsobem kdo provádíte import dat z Clavia do VuFindího solr. Mě se při použití exportu z Clavia do marc 21 a následném importu do VuFindu nedaří správně pořešit kodování diakritiky. Z Clavia se mi daří dostat jen ve win1250, což při importu nedělá dobrotu (a překodování vzhledem k tomu, že marc je binární je poněkud problém).

Děkuji
Administrátor zakázal veřejné příspěvky.

Re: Import dat z Clavia - kodování 4 roků 6 měsíců zpět #31


  • Příspěvky:45 Obdržená poděkování 5
  • Avatar uživatele Michal
  • Michal
  • Administrátor
  • OFFLINE
  • Karma: 5
Zdravim,
pro změnu kodóvaní MARC/UNIMARC souborů nejčastěji používám MarcEdit. Otestoval jsem celou řadu nástrojů a většinou neumí konverzi právě z WIN1250. Věřím, že se brzy dostaneme k tomu, že se píšeme několik praktických článků právě o této problematice.
Více o MarcEdit se dozvíte u nás v katalogu aplikací.
Konkrétně je to v MarcTools/Tools/Character Conversion Tools/Other Conversions.
Poslední úprava: 4 roků 6 měsíců zpět od Michal.
Administrátor zakázal veřejné příspěvky.

Re: Import dat z Clavia - kodování 4 roků 6 měsíců zpět #32


  • Příspěvky:3
  • Avatar uživatele ivanovj
  • ivanovj
  • Začátečník
  • OFFLINE
  • Karma: 1
Děkuju, ozkouším.
Administrátor zakázal veřejné příspěvky.

Re: Import dat z Clavia - kodování 4 roků 6 měsíců zpět #34


  • Příspěvky:3
  • Avatar uživatele ivanovj
  • ivanovj
  • Začátečník
  • OFFLINE
  • Karma: 1
Tak MarcEdit se při množství našich titulů (něco málo přes 100 tis.) ukázal ne příliš použitelným. Zjistil jsem ale, že v existuje PHP knihovna pro práci s Marcem (http://pear.php.net/package/File_MARC) a následující PHP skriptík překodování řeší, zdá se, velmi uspokojivě :-)
<?php 
require 'File/MARC.php';

$marc21_file = fopen("records-out.mrc", "wb");
$marc_source = new File_MARC('records-in.mrc');

while ($marc_record = $marc_source->next()) {
     foreach ($marc_record->getFields() as $tag=>$value) {

     if ($value instanceof File_MARC_Data_Field) {

         // Iterate through the subfields in this data field
         foreach ($value->getSubfields() as $code=>$subfield) {
             $subfield->setData(iconv('CP1250','UTF-8', $subfield->getData()));
         }
     }
 }
    
fwrite($marc21_file,$marc_record->toRaw());
}
?>
Administrátor zakázal veřejné příspěvky.

Re: Import dat z Clavia - kodování 4 roků 6 měsíců zpět #35


  • Příspěvky:45 Obdržená poděkování 5
  • Avatar uživatele Michal
  • Michal
  • Administrátor
  • OFFLINE
  • Karma: 5
Zdravím,
osobně jsem zkoušel soubor, který měl cca 130.000 záznamů a prošlo to naprosto bez problému. Každopádně ten script vypadá užitečně.
Administrátor zakázal veřejné příspěvky.

Re: Import dat z Clavia - kodování 4 roků 6 měsíců zpět #36


  • Příspěvky:9 Obdržená poděkování 2
  • Avatar uživatele xmorave2
  • xmorave2
  • Administrátor
  • OFFLINE
  • Karma: 3
Ten script se může ještě hodně hodit, mám v plánu i pár zajímavých vylepšení pro administraci Vufindu a automatické importování záznamů...
Administrátor zakázal veřejné příspěvky.

Projekt vznikl za podpory
Kabinet Informacnich studii a knihovnictvi, MU Brno    Mestska knihovna Ceska Trebova    Mestska knihovna Usti nad Orlici