今天笔试遇到一道题目,贴出来看大家的解法如何。
有一个2G 大的文件存放着ip地址,请统计出重复次数最多的前10个。
查了一些网上类似的问题,思路通常都是讲大文件切分成许多个小文件,采用分而治之的思想,算出每个文件中最多的一个,并且记录次数。然后在求前10。
本文共 180 字,大约阅读时间需要 1 分钟。
今天笔试遇到一道题目,贴出来看大家的解法如何。
有一个2G 大的文件存放着ip地址,请统计出重复次数最多的前10个。
查了一些网上类似的问题,思路通常都是讲大文件切分成许多个小文件,采用分而治之的思想,算出每个文件中最多的一个,并且记录次数。然后在求前10。
转载于:https://my.oschina.net/gaohongtian/blog/495294