解决DicomTag中文乱码的编码解析对照表
Dicom 解析中文DicomTag出现乱码问题解决
DICOM Tag信息一般都以英文存储,出现中文时,可能会出现显示为乱码的情况,而导致乱码的原因通常是,存储的信息含有中文,而DICOM tag中指定的编码格式SpecificCharacterSet并不支持中文 (多少和原图生产方脱不了关系).
比较常见的DICOM tag编码一般采用的是ISO_IR 100,存储于dcm 属性SpecificCharacterSet(即0008,0005) tag中,然而该编码格式并不支持中文,从而当DICOMTag出现中文时,正常读取就会出现乱码,最好将这个tag的值改为ISO_IR 192即UTF-8等支持中文的编码
下面是比较常见的编码对照关系表 可用作参考:
| DICOM 字符集 | 编码 |描述 |
| ------------ | ------------ | ------------ |
| ISO_IR 100 | latin_1 | |
| ISO_IR 101 | iso8859_2 | |
| ISO_IR 109 | iso8859_3 | |
| ISO_IR 110 | iso8859_4 | |
| ISO_IR 126 | iso_ir_126 | # Greek
| ISO_IR 127 | iso_ir_127 | # Arabic
| ISO_IR 138 | iso_ir_138 | # Hebrew
| ISO_IR 144 | iso_ir_144 | # Russian
| ISO_IR 148 | iso_ir_148 | # Turkish
| ISO_IR 166 | iso_ir_166 | # Thai
| ISO 2022 IR 6 | iso8859 | # alias for latin_1 too
| ISO 2022 IR 13 | shift_jis| |
| ISO 2022 IR 87 | iso2022_jp | |
| ISO 2022 IR 100 | latin_1 | |
| ISO 2022 IR 101 | iso8859_2 | |
| ISO 2022 IR 109 | iso8859_3 | |
| ISO 2022 IR 110 | iso8859_4 | |
| ISO 2022 IR 126 | iso_ir_126 | |
| ISO 2022 IR 127 | iso_ir_127 | |
| ISO 2022 IR 138 | iso_ir_138 | |
| ISO 2022 IR 144 | iso_ir_144 | |
| ISO 2022 IR 148 | iso_ir_148 | |
| ISO 2022 IR 149 | euc_kr | |
| ISO 2022 IR 159 | iso2022_jp_2 | |
| ISO 2022 IR 166 | iso_ir_166 | |
| ISO 2022 IR 58 | iso_ir_58 | |
| ISO_IR 192 | UTF8 | # from Chinese example, 2008 PS3.5 Annex J p1-4 |
| GB18030 | GB18030 | |
| ISO 2022 GBK | GBK | # from DICOM correction CP1234
| ISO 2022 58 | GB2312 | # from DICOM correction CP1234
| GBK | GBK | # from DICOM correction CP1234