複数文字の並べ替えを解決しようとしています。以下は、データからの行のカップルです。
data = pandas.read_csv('data.csv')
データ
[email protected]|@[email protected]|@[email protected]|@IND123
[email protected]|@[email protected]|@[email protected]|@IND223
[email protected]|@[email protected]|@[email protected]|@IND333
[email protected]|@[email protected]|@[email protected]|@IND443
以下のコードを試しています:
res = re.split('@|@',data)
印刷(解像度)
[email protected]|@[email protected]|@[email protected]|@IND123
['001', '|', '02', '|', 'ABC', '|', 'IND123']
提案してください。
正規表現では、x|y
は x
または y
を意味するため、パイプを エスケープ する必要があります。正規表現は @
または @
でデータを分割します。 pd.read_csv
の sep
引数として正規表現セパレータを指定して、pandas がデータを読み取るときにデータを正しく分割することもできます。
pd.read_csv('data.csv', header = None, sep='@\\|@', engine = 'python')
0 1 2 3
0 1 2 ABC IND123
1 2 2 ABC IND223
2 3 2 ABC IND333
3 4 2 ABC IND443