utf8 pragma
[migration-tools.git] / dump_inverse_select_marc.pl
1 #!/usr/bin/perl
2 use open ':utf8';
3 use MARC::Batch;
4 use MARC::Record;
5 use MARC::File::XML ( BinaryEncoding => 'utf-8' );
6 use MARC::Field;
7
8 my $format = $ARGV[0];
9
10 my $record_id_file = $ARGV[1];
11 my %record_ids;
12
13 open FILE, $record_id_file;
14 while (my $record_id = <FILE>) {
15     chomp($record_id); $record_ids{ $record_id } = 1;
16 }
17 close FILE;
18
19 my $id_tag = $ARGV[2]; my $id_subfield = $ARGV[3];
20
21 binmode(STDOUT, ':utf8');
22 binmode(STDIN, ':utf8');
23
24 foreach $argnum ( 4 .. $#ARGV ) {
25
26         print STDERR "Processing " . $ARGV[$argnum] . "\n";
27
28         my $batch = MARC::Batch->new('XML',$ARGV[$argnum]);
29         $batch->strict_off();
30         $batch->warnings_off();
31
32     my $count = 0;
33
34         while ( my $record = $batch->next() ) {
35
36         $count++;
37
38                 my $id = $record->field($id_tag);
39                 if (!$id) {
40                         print STDERR "ERROR: This record is missing a $id_tag field.\n" . $record->as_formatted() . "\n=====\n";
41                         next;
42                 }
43                 $id = $id->as_string($id_subfield);
44
45         if (! defined $record_ids{ $id }) {
46             if ($format eq 'text') {
47                 print STDOUT '=-' x 39 . "\n";
48                 print STDOUT $record->as_formatted() . "\n";
49             } else {
50                 print STDOUT $record->as_xml() . "\n";
51             }
52         }
53         }
54     print STDERR "Processed $count records.\n";
55 }