TOP
データ活用
データ交換ノウハウ：メインフレームからの負のアンパック数値が文字化けする

2015/02/17

データ活用

データ交換ノウハウ：メインフレームからの負のアンパック数値が文字化けする

メインフレームからの交換データで、数値フィールドの１桁目がアルファベットになっているので、数値として読み込めないことがあります。<br/ > これは、COBOL等で生成したファイルをそのまま転送ツールの文字コード変換にかけて生成したのが原因と考えられます。

COBOLでよく使用される数値型にはパックとゾーン（アンパック）があります。<br/ > パックは、8ビットの上位下位をそれぞれ数値の一桁とし、１桁目を符号とします。
小数点位置は固定で、扱うアプリがフォーマットで定義します。つまり、データ中には小数点位置は記載されません。

COBOLデータ定義

アンパック（ゾーン）は、数値のキャラクタをそのまま書きますが、数値が負の場合のみ、１桁目にマスクがかかります。小数点の扱いはパックと同様です。

COBOLデータ定義

メインフレームでは数値文字列（「-1.123」のように見たままの形式）は可変長表現であることからあまり使用されないため、COBOLでデータ生成をする場合にはたいていパックかゾーンになります。パックはバイナリ表現のためデータのレコードレイアウトを意識しないとコード変換ができないため、ゾーンを使用する事が多いという事情があります。

問題は、サンプルデータが正の数値ばかりである場合、単純なEBCDIC/ASCIIのコード変換で大丈夫だろうと判断されてしまったことでしょう。

EBCDICでアンパック

IBM COBOLのEBCDICのゾーンの場合、符号桁の上位４ビットは正の数の場合が0xF、負の数の場合が0xDなので、単純にコード変換した場合、相当する文字コードに変換されてしまいます。

負の符号桁は、ちょうどアルファベットの「}」から「R」に相当するため、変換後のASCIIデータの１桁目がアルファベットになるわけです。

符号桁をそのままコード変換したものと正しいASCII符号との対比

幸い、マスク後のデータは文字コードとして有効ですから、プログラムで判断する場合は、数値の１桁目がASCIIの数値コードに該当しない場合は負の数値として扱うことで対処できます。

一方、UNIXやWindows系のCOBOLでそのままデータを使用する場合は変換が必要です。
符号ビットは６ビット目が1になるという説もありますが、実はコンパイラメーカーごとに定義がバラバラで、単純変換した文字コードとも異なるためです。

データ提供元の人々は自分の言葉と常識で語るので、データ変換の仕様策定を行う場合には、相手先プラットフォームについての知識が必要になってくるわけです。

追記：Waha! Transformer 製品サイトの関連コンテンツ

Waha! Transformer の対応データソースと対応文字コード体系

データの抽出や加工、連携にお悩みではありませんか？

20年以上の実績に裏打ちされた信頼のデータ連携ツール「Waha! Transformer」で、自社に眠るデータを有効活用。まずは無料のハンズオンセミナーや体験版で効果を実感していただけます。

＞純国産ETLツール「Waha! Transformer」

Waha! Transformer

関連記事

データ交換ノウハウ：メインフレームからの負のアンパック数値が文字化けする

データドリブン経営の前提として考えるMVV：ミッション・ビジョン・バリューと戦略・戦術・戦法

データ交換ノウハウ：メインフレームからの負のアンパック数値が文字化けする

ETLとは？EAIとの違いから考えるデータ活用基盤のアプローチ～“2025年の崖”が警鐘を鳴らしたのは「データが活用できない」こと～

データ交換ノウハウ：メインフレームからの負のアンパック数値が文字化けする

デジタル人材ならおさえておきたいニーズとウォンツの違い～営業パーソンの必須スキルは市場調査？～

データ交換ノウハウ：メインフレームからの負のアンパック数値が文字化けする

デジタル人材のいない企業が「アジャイル」でうまくいかない理由～アジャイルとプロトタイピングの違い～

メールマガジンの登録はこちらから

Rankingランキング

ITIL®とは～ITサービスマネジメントのフレームワーク～

IDaaSとは？～市場シェアや機能、サービスを比較する際のポイントなどをわかりやすく解説～

カスタマーサクセスにおいて重要なLTVの計算方法とLTV管理の際の課題

シングルサインオン（SSO）とは？テレワークで注目される3つのメリット～クラウドのID・パスワードを減らして安全快適なテレワークを～

チームワークを高めるには？チームビルディングには共有・共感・共鳴・共創の4つの「共」が重要

New arrival新着

ビジネスとITのハブとなるIT部門がやるべき4つのステップ後編～あるべき姿～

ビジネスとITのハブとなるIT部門がやるべき4つのステップ中編～課題～

ビジネスとITのハブとなるIT部門がやるべき4つのステップ前編～現状～

2019/04/01: お知らせ IT情報メディアサイト「idearu」（アイディアル）オープン！

Keywordキーワード

Recommendedおすすめ

システム運用

【2024年秋】郵便料金値上げによるコストの増加を回避するには？

目次郵便料金値上げの省令案の概要企業における郵便料金値上げの影響郵便料金値上げに伴うコスト増加...

システム運用

DXの推進は帳票運用業務の改善から！

国内におけるDX（デジタルトランスフォーメーション）の推進を目的として経済産業省から2018年9月に...

データ活用

製造業におけるリスキリングの重要性

リスキリングとは、日本語で「職業能力の再開発」といい、今後求められる能力やスキルに合わせた学び直しを...

メルマガ登録お問い合わせ