JIS2004とは、従来の日本語文字コード規格(JIS X 0208+JIS X 0212)を拡張した文字コード規格(JIS X 0213)の通称である。

JIS2004では、多数の漢字や符合を追加し、いわゆる「機種依存文字」も取り込んでいる。また、Windows VistaがJIS2004を採用していること、人名などが充実しているため、官公庁や地方公共団体での採用が期待されている。

JIS2004は正確に言うと、文字集合の規定であり、どのエンコーディングを使うかはまた別の話である。JIS2004が使えるエンコーディングとしては、Unicode(ISO 10646)の、UTF-8などを使うことが多い。PostgreSQLでも、UTF-8を使う限りは8.3でなくてもJIS2004を利用できる。

ただ、JIS2004ではシフトJIS、EUC-JPに相当するエンコーディングも規定されており、これらは8.3では、SHIFT_JIS_2004、EUC_JIS_2004として実装されている。UTF-8との相互変換も可能だ。UTF-8は最近広く使われるようになったが、漢字をソートすると、でたらめに近い結果が返るなど、業務上不都合な場合も多い。そういった場合は、DBのエンコーディングはEUC_JIS_2004にしておき、クライアント側にはUTF-8を使用することも可能だ。