JENKAで取り扱える文字コードを教えてください

JENKAで取り扱える文字コードを教えてください

JENKA上での文字コードの取り扱い

JENKAのウェブサイト上での文字コード

原則として、JENKA のサイト上で入力する文字や、データベースに保存したりプログラム上で処理する情報は Unicode (UTF-8) として取り扱います。
これには、お客様がJENKAのサイト上で閲覧可能な文字と、お客様がJENKAのサイト上で手動で入力可能な文字すべてが対象となります。

連携サービスの中にあるファイルの文字コード

連携先のストレージに保存されているファイルに関しては、原則としてそのファイルの文字コードのままで取り扱います。 (例: Google Drive, Box, OneDrive)
すなわち、Google Drive の特定のファイルを別のフォルダにコピーする場合、そのファイルに Shift JIS の文字コードが含まれていれば、コピーしたファイルも同様に Shift JIS が含まれたファイルとなります。

JENKA内に連携サービスのファイルをダウンロードした場合

JENKA内に一時的にダウンロードされたファイルに含まれる文字コードは、ダウンロード元のファイルの文字コードを維持します。

JENKAのコネクタに、文字コードの変換機能がある場合

一部のコネクタは、JENKA内にダウンロードしたファイルを読み込んで、その内容を加工することができます。(例: データ変換コネクタの文字コード変換アクション)
文字コードを指定する機能は補助的な役割であり、指定する文字コードやファイルの内容によっては意図しない文字コードとして処理される可能性があります。

文字化けやすい状況の例

シフトJIS(CP932) から、CP932かUTF-8以外の文字コードに変換する場合

CP932はシフトJISの一種で、以下に挙げる拡張文字と呼ばれる文字が含まれています。これらの拡張文字が他の文字コードで存在しない場合には文字が化ける可能性があります。
これらの文字が含まれるファイルがシフトJISとして保存されている場合、文字コードの規格としては CP932 である可能性が高いといえます。
ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ¦'"
纊褜鍈銈蓜俉炻昱棈鋹曻彅丨仡仼伀伃伹佖侒侊侚侔俍偀倢俿倞偆偰
偂傔僴僘兊兤冝冾凬刕劜劦勀勛匀匇匤卲厓厲叝﨎咜咊咩哿喆坙坥垬
埈埇﨏塚增墲夋奓奛奝奣妤妺孖寀甯寘寬尞岦岺峵崧嵓﨑嵂嵭嶸嶹巐
弡弴彧德忞恝悅悊惞惕愠惲愑愷愰憘戓抦揵摠撝擎敎昀昕昻昉昮昞昤
晥晗晙晴晳暙暠暲暿曺朎朗杦枻桒柀栁桄棏﨓楨﨔榘槢樰橫橆橳橾櫢
櫤毖氿汜沆汯泚洄涇浯涖涬淏淸淲淼渹湜渧渼溿澈澵濵瀅瀇瀨炅炫焏
焄煜煆煇凞燁燾犱犾猤猪獷玽珉珖珣珒琇珵琦琪琩琮瑢璉璟甁畯皂皜
皞皛皦益睆劯砡硎硤硺礰礼神祥禔福禛竑竧靖竫箞精絈絜綷綠緖繒罇
羡羽茁荢荿菇菶葈蒴蕓蕙蕫﨟薰蘒﨡蠇裵訒訷詹誧誾諟諸諶譓譿賰賴
贒赶﨣軏﨤逸遧郞都鄕鄧釚釗釞釭釮釤釥鈆鈐鈊鈺鉀鈼鉎鉙鉑鈹鉧銧
鉷鉸鋧鋗鋙鋐﨧鋕鋠鋓錥錡鋻﨨錞鋿錝錂鍰鍗鎤鏆鏞鏸鐱鑅鑈閒隆﨩
隝隯霳霻靃靍靏靑靕顗顥飯飼餧館馞驎髙髜魵魲鮏鮱鮻鰀鵰鵫鶴鸙黑
ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩ№℡㈱
①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳
㍉㌔㌢㍍㌘㌧㌃㌶㍑㍗㌍㌦㌣㌫㍊㌻
㎜㎝㎞㎎㎏㏄㎡㍻〝〟
㏍㊤㊥㊦㊧㊨㈲㈹㍾㍽㍼∮∑∟⊿

UTF-8 から UTF-8 以外の文字コードに変換した場合

JIS第3水準以降の漢字・記号・絵文字・他国の文字などが、UTF-8 以外の文字コードで化ける場合があります。これは「UTF-8 には存在するがそれ以外の文字コードに存在しない」文字が存在するためです。
携帯電話向けに誕生し、後年 UTF-8 に採用された絵文字が代表的な例です。

文字化けを防ぐには

ファイルの文字コードを UTF-8 として保存する

最も文字化けする可能性が低くなるのは、ファイルを作成する際の文字コードを UTF-8 にする場合です。
UTF-8 は、広範な種類の文字が収録されているため、いわゆる「機種依存文字」の問題が起こりづらくなっています。