adding bad-XML catch and error report
[migration-tools.git] / spit_csv.pl
1 #!/usr/bin/perl
2 use MARC::Batch;
3 use MARC::File::XML ( BinaryEncoding => 'utf-8' );
4 use MARC::Field;
5 use Unicode::Normalize;
6
7
8 my @desired_tags_subfields = ();
9 foreach my $argnum ( 1 .. $#ARGV) {
10     print STDERR $ARGV[$argnum] . "\n";
11     push @desired_tags_subfields, $ARGV[$argnum];
12 }
13
14 my $count = 0;
15
16 binmode(STDOUT, ':utf8');
17 binmode(STDIN, ':utf8');
18
19 foreach my $argnum ( 0 .. 0 ) {
20
21         print STDERR "Processing " . $ARGV[$argnum] . "\n";
22
23     my $M;
24     open $M, '<:utf8', $ARGV[$argnum];
25     my $batch = MARC::Batch->new('XML',$M);
26
27         $batch->strict_off();
28         $batch->warnings_off();
29
30         while ( my $record = $batch->next() ) {
31
32         $count++;
33
34                 print STDERR "WARNINGS: Record $count : " .  join(":",@warnings) . " : continuing...\n" if ( @warnings );
35
36         my $first = 1;
37         for (my $i = 0; $i < scalar(@desired_tags_subfields); $i+=2) {
38                     my @tags = (); 
39             if ($record->field($desired_tags_subfields[$i])) { 
40                 @tags = $record->field($desired_tags_subfields[$i]); 
41             }
42             if (scalar(@tags)>1) { 
43                 die "Multiple $desired_tags_subfields[$i]\n"; 
44             } elsif (scalar(@tags)==0) { 
45                 print STDERR "Record $count missing $desired_tags_subfields[$i]\n"; 
46                 goto END_OF_WHILE; 
47             }
48             foreach my $f ( @tags ) { 
49                 if ($f->subfield($desired_tags_subfields[$i+1])) { 
50                     if ($first) {
51                         $first = 0;
52                     } else {
53                         print STDOUT "\t";
54                     }
55                     print STDOUT $f->subfield($desired_tags_subfields[$i+1]);
56                 } 
57             }
58         }
59         print STDOUT "\n";
60         END_OF_WHILE:
61         }
62         print STDERR "Processed $count records\n";
63 }