『QQ:1353814576』

解决DicomTag中文乱码的编码解析对照表


Dicom 解析中文DicomTag出现乱码问题解决

DICOM Tag信息一般都以英文存储,出现中文时,可能会出现显示为乱码的情况,而导致乱码的原因通常是,存储的信息含有中文,而DICOM tag中指定的编码格式SpecificCharacterSet并不支持中文 (多少和原图生产方脱不了关系).

比较常见的DICOM tag编码一般采用的是ISO_IR 100,存储于dcm 属性SpecificCharacterSet(即0008,0005) tag中,然而该编码格式并不支持中文,从而当DICOMTag出现中文时,正常读取就会出现乱码,最好将这个tag的值改为ISO_IR 192即UTF-8等支持中文的编码

下面是比较常见的编码对照关系表 可用作参考:

DICOM 字符集 编码 描述
ISO_IR 100 latin_1
ISO_IR 101 iso8859_2
ISO_IR 109 iso8859_3
ISO_IR 110 iso8859_4
ISO_IR 126 iso_ir_126 # Greek
ISO_IR 127 iso_ir_127 # Arabic
ISO_IR 138 iso_ir_138 # Hebrew
ISO_IR 144 iso_ir_144 # Russian
ISO_IR 148 iso_ir_148 # Turkish
ISO_IR 166 iso_ir_166 # Thai
ISO 2022 IR 6 iso8859 # alias for latin_1 too
ISO 2022 IR 13 shift_jis
ISO 2022 IR 87 iso2022_jp
ISO 2022 IR 100 latin_1
ISO 2022 IR 101 iso8859_2
ISO 2022 IR 109 iso8859_3
ISO 2022 IR 110 iso8859_4
ISO 2022 IR 126 iso_ir_126
ISO 2022 IR 127 iso_ir_127
ISO 2022 IR 138 iso_ir_138
ISO 2022 IR 144 iso_ir_144
ISO 2022 IR 148 iso_ir_148
ISO 2022 IR 149 euc_kr
ISO 2022 IR 159 iso2022_jp_2
ISO 2022 IR 166 iso_ir_166
ISO 2022 IR 58 iso_ir_58
ISO_IR 192 UTF8 # from Chinese example, 2008 PS3.5 Annex J p1-4
GB18030 GB18030
ISO 2022 GBK GBK # from DICOM correction CP1234
ISO 2022 58 GB2312 # from DICOM correction CP1234
GBK GBK # from DICOM correction CP1234