Speadsheet::ParseExcel.pm - 0.2405
by 川合孝典 (Hippo2000)
更新履歴はChangesをご覧ください
概要
このモジュールは、まだαバージョンです。
Microsoft社のExcelファイルをWindows以外のプラットフォームでも情報を取り
出すようにするモジュールです。
動作確認
DOS/V WindowsNT ver.4.0 Perl5.005
DOS/V TurboLinux ver.6.0 Perl5.005
Sun Sparc Solaris 2.6 Perl5.005
DOS/V Vine Linux 2.0 Perl5.005
Macintosh JPerl、FreeBSDでも動いているというレポートをいただいています
その他の環境で実行された方は、教えてください。
動いても動かなくても、ご協力よろしくお願いします。 <(__)>
簡単な確認(testディレクトリ)
sampleディレクトリに以下のファイルが入っています:
sample.pl :簡単なテストスクリプト(Spreadsheet::ParseExcel::FmtDefaultを使用)
sample_j.pl :簡単なテストスクリプト(Spreadsheet::ParseExcel::FmtJapanを使用、コードを指定して出力)
res_sample :sample.plの実行結果
res_sample_j:sample_j.plの実行結果(euc)
dmpEx.pl : Excelファイルの内容を表示する(Spreadsheet::ParseExcel::FmtDefaultを使用)
dmpExj.pl : Excelファイルの内容を表示する(Spreadsheet::ParseExcel::FmtJapanを使用)
簡単にこのモジュールの動きを確認したいだけであれば、dmpExj.plによって
指定したExcelファイルの内容を表示させることができます。
ex.
# perl -I.. dmpExj.pl Excel/Test97.xls euc
「-I..」は、親ディレクトリにあるSpreadsheet::ParseExcel.pmを利用するために指定します。
「Excel/Test97.xls」は対象となるファイル名。
「euc」は漢字を出力するときの文字コードです。euc、sjis、jisなど
Jcode.pmと同じです。
インストール
OLE::Storage_Liteがインストールされている必要があります。
Spreadsheet::ParseExcel::FmtJapanを使用する場合、Jcode.pmを必要とします。(他のモジュールを必要としません。)
Spreadsheet::ParseExcel::FmtJapan2を使用する場合、Jcode.pm、Unicode::Mapを必要とします。
Perlの標準的なインストールになりました。このモジュール自体はPerlのみで作成されているので、コピーするだけでも動きます。
perl Makefile.PL
make
make test
make install (rootになって)
FmtJapan2のために
機種依存文字に対応するためのFmtJapan2を0.09から同梱します。
利用するためにはUnicode::Mapをインストールするほか、以下の手順が必要になります:
(1) 同梱される"CP932Excel.map"を適切なディレクトリにコピーします。
(2) "CP932Excel"をマップ名として追加するために、Unicode::Map階層にあるREGISTRYに以下の行を追加します。
(mapのディレクトリ名は適切なディレクトリ名にしてください)
name: CP932Excel
srcURL: $SrcUnicode/VENDORS/MICSFT/WINDOWS/CP932.TXT
src: $DestUnicode/VENDORS/MICSFT/WINDOWS/CP932.TXT
map: (コピー先のディレクトリ)/CP932Excel.map
# Don't remove this line
使い方
use strict;
use Spreadsheet::ParseExcel;
my $oExcel = new Spreadsheet::ParseExcel;
my $oBook = $oExcel->Parse('Excel/Test97.xls');
#または日本語対応では
use strict;
use Spreadsheet::ParseExcel;
use Spreadsheet::ParseExcel::FmtJapan;
my $oExcel = new Spreadsheet::ParseExcel;
my $oFmtJ = Spreadsheet::ParseExcel::FmtJapan->new(Code => 'euc'); #sjis、jisなどのコード
my $oBook = $oExcel->Parse('Excel/Test97.xls', $oFmtJ);
#情報の取り出し例
my($iR, $iC, $oWkS, $oWkC);
print "FILE :", $oBook->{File} , "\n";
print "COUNT :", $oBook->{SheetCount} , "\n";
print "AUTHOR:", $oBook->{Author} , "\n";
for(my $iSheet=0; $iSheet < $oBook->{SheetCount} ; $iSheet++) {
$oWkS = $oBook->{Worksheet}[$iSheet];
print "--------- SHEET:", $oWkS->{Name}, "\n";
for(my $iR = $oWkS->{MinRow} ;
defined $oWkS->{MaxRow} && $iR <= $oWkS->{MaxRow} ; $iR++) {
for(my $iC = $oWkS->{MinCol} ;
defined $oWkS->{MaxCol} && $iC <= $oWkS->{MaxCol} ; $iC++) {
$oWkC = $oWkS->{Cells}[$iR][$iC];
print "( $iR , $iC ) =>", $oWkC->Value, "\n" if($oWkC);
}
}
}
問題点・バグ
最大の問題点であった「Exce97 デベロッパーズ キット」が手に入りました。
ただただHirofumi Morisadaさんに感謝、感謝です。
Excel97/2000で保存した場合、FmtJapanでは機種依存文字((株)やローマ数字のIなど)が〓になってしまいます。
FmtJapan2では一応対応しているつもりです。
まだテストもちゃんとできていません。とりあえずは動くでしょう。 <(__)>
TurboLinux Version 6で作成しているので、他の環境でどうなるのかとても気に
なります。
Solarisでは動作確認をしてもらいました。(まだ不具合がありそうですが)
コメント、バグレポートをお待ちしています 川合孝典:kwitknr@cpn.org
やらなきゃいけないこと:
テスト!
ドキュメントの整備
出力への対応 (^_^) Spreadsheet::WriteExcelを使っていただくのが一番
だれかまるごと引きついてくれる人はいませんか?(^^)
謝辞:
こんな半端な状態で謝辞もあったものではありませんが、以下のプログラム、
モジュールを参考にさせていただきました。
xlHtml
OLE::Storage
herbert (OLE::Storageに同梱されるツール)
Spreadsheet::WriteExcel
Solarisのデバッグは島本武氏と山路春奈さんがいなければ、成立しませんでした。(cloudyに感謝)
埜口晴美さんにはExcel2000のファイルをいただきました。
Hirofumi Morisadaさんからの情報で文字列のバグを発見、修正することができました。
そして「Excel97デベロッパーズキット」をどうもありがとうございました。
その他、たくさんの方からの動作報告やバグレポートをいただき感謝、感謝です。