notices reports added to mig-xml
[migration-tools.git] / mig-bin / mig-loadbibs
index a6840de..a90ab64 100755 (executable)
@@ -39,6 +39,8 @@ use MARC::Record;
 use MARC::Batch;
 use MARC::File;
 use MARC::File::XML;
+use MARC::Charset 'marc8_to_utf8';
+binmode STDIN, ':bytes';
 use Env qw(
     HOME PGHOST PGPORT PGUSER PGDATABASE MIGSCHEMA
     MIGBASEWORKDIR MIGBASEGITDIR MIGGITDIR MIGWORKDIR
@@ -57,7 +59,7 @@ pod2usage(-verbose => 2) if defined $ARGV[0] && $ARGV[0] eq '--help';
 pod2usage(-verbose => 1) if ! $ARGV[1];
 
 my $next_arg_is_file = 0;
-my $append_is_false = 1;
+my $append = 0;
 my $next_arg_is_source = 0;
 my $source = 'default';
 my $file_is_xml = 0;
@@ -67,6 +69,12 @@ my $i = 0;
 my $batch;
 binmode STDIN, ':utf8';
 
+my $ignore = MARC::Charset->ignore_errors();    
+MARC::Charset->ignore_errors(1);
+my $setting = MARC::Charset->assume_unicode();
+MARC::Charset->assume_unicode(1); 
+MARC::Charset->ignore_errors(1);
+
 foreach my $arg (@ARGV) {
     if ($arg eq '--stage_file') {
         $next_arg_is_file = 1;
@@ -81,13 +89,13 @@ foreach my $arg (@ARGV) {
         $next_arg_is_source = 1;
         next;
     }
-    if ($next_arg_is_file) {
+    if ($next_arg_is_source) {
         $source = $arg;
         $next_arg_is_source = 0;
         next;
     }
        if ($arg eq '--append') {
-               $append_is_false = 0;
+               $append = 1;
                next;
        }
     if ($arg eq '--xml') {
@@ -96,17 +104,13 @@ foreach my $arg (@ARGV) {
     }
 }
 
-if ($append_is_false) {
-       $dbh->do(qq{
-       DROP TABLE IF EXISTS $MIGSCHEMA.biblio_record_entry_stage;
-       CREATE UNLOGGED TABLE $MIGSCHEMA.biblio_record_entry_stage (
-               l_bib_id    TEXT,
-                       x_source        TEXT,
-                       x_warnings      TEXT,
-               x_migrate   BOOLEAN DEFAULT TRUE
-       ) INHERITS ($MIGSCHEMA.biblio_record_entry);
-       });
-}
+create_child_table($dbh); #and test to see if it exists 
+
+# normal stage table creation
+if ($append == 0) { 
+    drop_stage_table($dbh); 
+    create_stage_table($dbh);
+    }
 
 if ($file_is_xml) {
        $batch = MARC::Batch->new('XML',$infile);
@@ -125,7 +129,7 @@ while ( my $record = $batch->next() ) {
        my @warnings = $batch->warnings();
        my $warning_string;
        if (@warnings) { $warning_string = "'" . join(':',@warnings) . "'"; } else { $warning_string = "'none'"; }
-       my $sql = "INSERT INTO $MIGSCHEMA.biblio_record_entry_stage (marc,x_source,x_warnings) VALUES ($xml,$source,$warning_string);";
+       my $sql = "INSERT INTO $MIGSCHEMA.biblio_record_entry_stage (marc,x_source,x_warnings) VALUES ($xml,'$source',$warning_string);";
     my $sth = $dbh->prepare($sql);
     $sth->execute();
        report_progress("Records staged", $i) if 0 != $i % 100;
@@ -138,8 +142,45 @@ $dbh->do(qq/
 
 print "Finis.\n";
 
+
+sub drop_stage_table {
+    my $dbh = shift;
+    $dbh->do("DROP TABLE IF EXISTS $MIGSCHEMA.biblio_record_entry_stage;");
+    return();
+}
+
+sub create_stage_table {
+       my $dbh = shift;
+
+    $dbh->do("CREATE UNLOGGED TABLE $MIGSCHEMA.biblio_record_entry_stage (
+            l_bib_id    TEXT,
+            x_source    TEXT,
+            x_warnings  TEXT,
+            x_migrate   BOOLEAN DEFAULT TRUE
+        ) INHERITS ($MIGSCHEMA.biblio_record_entry);");
+
+    return();
+}
+
+sub create_child_table {
+    my $dbh = shift;
+
+    $dbh->do("DO \$\$ 
+        DECLARE
+            t   BOOLEAN;
+        BEGIN
+        SELECT EXISTS(SELECT 1 FROM information_schema.tables WHERE table_schema = '$MIGSCHEMA' AND table_name = 'biblio_record_entry') INTO t;
+        IF t = FALSE THEN
+            PERFORM migration_tools.build_specific_base_staging_table ('$MIGSCHEMA','biblio.record_entry');
+        END IF;
+        END \$\$;");
+
+    return ();
+}
+
 sub clean_marc {
     my $xml = shift;
+    $xml = marc8_to_utf8($xml);
     $xml =~ s/\n//sog;
     $xml =~ s/^<\?xml.+\?\s*>//go;
     $xml =~ s/>\s+</></go;