preserve dates we can't parse; we'll punt to postgres
[migration-tools.git] / spit_csv.pl
1 #!/usr/bin/perl
2 use MARC::Batch;
3 use MARC::File::XML ( BinaryEncoding => 'utf-8' );
4 use MARC::Field;
5 use Unicode::Normalize;
6
7
8 my @desired_tags_subfields = ();
9 foreach my $argnum ( 1 .. $#ARGV) {
10     print STDERR $ARGV[$argnum] . "\n";
11     push @desired_tags_subfields, $ARGV[$argnum];
12 }
13
14 my $count = 0;
15
16 binmode(STDOUT, ':utf8');
17 binmode(STDIN, ':utf8');
18
19 foreach my $argnum ( 0 .. 0 ) {
20
21         print STDERR "Processing " . $ARGV[$argnum] . "\n";
22
23         my $batch = MARC::Batch->new('XML',$ARGV[$argnum]);
24         $batch->strict_off();
25         $batch->warnings_off();
26
27         while ( my $record = $batch->next() ) {
28
29         $count++;
30
31                 print STDERR "WARNINGS: Record $count : " .  join(":",@warnings) . " : continuing...\n" if ( @warnings );
32
33         my $first = 1;
34         for (my $i = 0; $i < scalar(@desired_tags_subfields); $i+=2) {
35                     my @tags = (); 
36             if ($record->field($desired_tags_subfields[$i])) { 
37                 @tags = $record->field($desired_tags_subfields[$i]); 
38             }
39             if (scalar(@tags)>1) { 
40                 die "Multiple $desired_tags_subfields[$i]\n"; 
41             } elsif (scalar(@tags)==0) { 
42                 print STDERR "Record $count missing $desired_tags_subfields[$i]\n"; 
43                 goto END_OF_WHILE; 
44             }
45             foreach my $f ( @tags ) { 
46                 if ($f->subfield($desired_tags_subfields[$i+1])) { 
47                     if ($first) {
48                         $first = 0;
49                     } else {
50                         print STDOUT "\t";
51                     }
52                     print STDOUT $f->subfield($desired_tags_subfields[$i+1]);
53                 } 
54             }
55         }
56         print STDOUT "\n";
57         END_OF_WHILE:
58         }
59         print STDERR "Processed $count records\n";
60 }