最想對媽媽說的話作文
1、有10個文件,每個文件1G,每個文件的每一行存放的都是用戶的query,每個文件的query都可能重復。要求你按照query的頻度排序。

hash映射:
1、順序讀取10個文件,按照hash(query)%10的結果將query寫入到另外10個文件(記為a0,a1,..a9)中。這樣新生成的文件每個的大小大約也1G(假設hash函數是隨機的)。
2、hash_map統計:找一臺內存在2G左右的機器,依次對(a0,a1,..a9)用hash_map(query, query_count)來統計每個query出現的次數。每個query出現一次,則count+1。
3、堆/快速/歸并排序:利用快速/堆/歸并排序按照出現次數進行排序,將排序好的query和對應的query_cout輸出到文件中,這樣得到了10個排好序的文件(記為b0,b1,..b9)。最后,對這10個文件進行歸并排序(內排序與外排序相結合)。
2、點評在和第三方網站合作的過程中,需要在由點評頁面跳轉到對方頁面的鏈接中加入信息來記錄點評自己的一些信息,例如用戶信息(包括id和識別串)、平臺(PC、WAP、APP等)、訪問時間等,但是對方只能保留一個由大寫字母和數字組成的字符串(長度小于等于128個字符,越短越好)來標識這樣一次訪問,之后會將該字符串回傳給點評。請為這個需求設計一對加密解密函數,函數原型如下:
struct DianPingInfo {
uint_32 userId, string userString, /pic/p>
Date viewTime, /pic/p>
uint_8 platform
};
string encode(uinit_32 userId, string userString, Date viewTime, short platform);
DianPingInfo decode(string);
可供編碼的字符需要大寫字母和數字總共有26+10=36個,那么只能編碼5個bit,需要將編碼前的5個字節編碼為8個字節。其實考慮到算法的簡單,可以只編碼4個bit,那就是每個字節用兩個字節編碼,這樣只需要使用大寫字母而不用數字。比如 一個字節是'a' ASCII碼為0x61,二進制為01100001,拆分為兩個4bit為0110和0001,然后都加上'A',就編碼成為了G和B。這一方式的缺點在于浪費一半空間
3、場景:
考察目的:linux文件系統
管理員有一臺普通的pc 機器,已安裝linux操作系統(如:centos 6.5)。管理員告訴你,在 /data 目錄下 只有1個100MB 大小的文件。他要求你找到這個文件并將它拷貝到 /home 目錄下。
問題:
1,由于不知道文件名,只知道文件大小。你能通過使用哪些 linux工具去找到這個文件?
2,找到該文件后,使用什么linux 命令去完成文件拷貝?
3,進行拷貝操作時,系統提示:沒有權限。你需要檢查哪些地方?
4,進行拷貝時,系統提示:磁盤滿,無法寫入。你需要使用什么linux命令,檢查哪些地方?
5,你估計完成這個文件拷貝需要多長時間?寫出你認為對拷貝時間影響比較大的因素,越多越好。
1、ls -lhs 會顯示 文件大小、讀寫執行權限、用戶組歸屬及文件名等信息
或者直接使用find命令 find /data -size 100M
2、cp /data/test /home
3、需要查看該文件的用戶組權限,使用 ll 命令查看該文件所有者信息,添加該用戶為該文件的歸屬組
使用chown和chgrp 可以修改文件用戶組權限
4、df -h /home
查看目的地址可以空間情況,如果可用空間不足則需要將文件拷貝到其他地方,或者將其他可以空間新掛載/home下
5、cp傳輸速度大約是8M/s,傳輸時間大約為10s +
影響因素:
1)緩存。測試以前要先把分區卸載掉,然后加載。這樣才沒有緩存了。包括目錄。
如果有緩存文件和目錄,速度差別特別大。
2)還要看文件在磁盤的位置。磁盤還有一個尋道時間平均9m/s.
3)如果是網絡傳輸,還需要考慮網絡延時、網絡帶寬等問題。
4)另外如果有加密的話,加密算法不同會明顯影響傳輸時間,越弱的加密算法傳輸速度越快
5)壓縮問題,壓縮會降低傳輸速度
【最想對媽媽說的話作文】相關文章:
最想對父母說的話優秀作文通用03-19
我想對媽媽說的話作文07-17
對媽媽說的話作文(精選32篇)12-27
想對媽媽說的話作文(精選30篇)11-22
想對媽媽說的話作文(精選32篇)12-25
想對媽媽說的話作文(精選27篇)05-13
想對媽媽說的話作文(通用35篇)12-25
想對媽媽說的話作文(通用20篇)05-10
對媽媽說的話作文500字(精選21篇)09-30
對媽媽說的話小學作文(通用3篇)02-09
- 相關推薦