關於linux系統下分割大文件的方法

在linux中分割大文件,比如一個5gb日誌文件,需要把它分成多個小文件,分割後以利於普通的文本編輯器讀取。

關於linux系統下分割大文件的方法

有時,需要傳輸20gb的大文件到另一臺服務器,也需要把它分割成多個文件,這樣便於傳輸數據。

以下通過五個不同的例子,來講解Linux下分割大文件的方法,供大家參考。

例1、以每個文件1000行分割

split命令分割文件成每個文件1000行,並且文件名依次爲 [前綴]aa, [前綴]ab, [前綴]ac等,默認的前綴是X,每個文件的行數爲1000行。

命令:

$ split mylog -l 1000

$ wc -l *

4450 mylog

1000 xaa

1000 xab

1000 xac

1000 xad

450 xae

例2、以每個文件20MB分割

分割文件爲多個20MB的文件,附帶-b選項。

命令:

$ split -b 20M logdata

$ ls -lh | tail -n +2

-rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata

-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xaa

-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xab

-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xac

-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xad

-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xae

-rw------- 1 sathiya sathiya 1.6M Jul 25 19:20 xaf

例3、以每個文件50MB指定前綴分割

使用–bytes選項把文件分割成多個50MB的文件,–bytes類似-b選項,在第二個參數指定前綴。

命令:

$ split --bytes=50M logdata mydatafile

$ ls -lh

total 204M

-rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata

-rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileaa

-rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileab

-rw------- 1 sathiya sathiya 1.6M Jul 25 19:23 mydatafileac

例4、基於行數分割文件

使用-l選項指定行數來把文件分割成多個行數相同的文件。

命令:

$ wc -l testfile

2591 testfile

$ split -l 1500 testfile importantlog

$ wc -l *

1500 importantlogaa

1091 importantlogab

2591 testfile

例5、以數字後綴命名分割文件

使用-d選項可以指定後綴爲數字,如00,01,02..,而不是aa,ab,ac。

命令:

$ split -d testfile

$ ls

testfile x00 x01 x02

可用選項

短選項 長選項 選項描述

-b –bytes=SIZE SIZE 值爲每一輸出檔案的大小,單位爲 byte。

-C –line-bytes=SIZE 每一輸出檔中,單行的最大 byte 數。

-d –numeric-suffixes 使用數字作爲後綴。

-l –lines=NUMBER NUMBER 值爲每一輸出檔的`列數大小。

短選項 長選項 選項描述

-b –bytes=SIZE SIZE 值爲每一輸出檔案的大小,單位爲 byte。

-C –line-bytes=SIZE 每一輸出檔中,單行的最大 byte 數。

-d –numeric-suffixes 使用數字作爲後綴。

-l –lines=NUMBER NUMBER 值爲每一輸出檔的列數大小。