推薦學習:
今天我們來模擬一個這樣的場景,我們在本地有多個文字檔案,每個檔案裡面存了很多的32位元的字串作為使用者的唯一標識,每個使用者存做一行,假如我們每天都有非常大規模的使用者,這樣我們可能在工作中就存在需要對這些使用者進行交集、並集或補集等處理,最簡單的方式是通過Java中的集合來進行運算即可,比如通過HashSet來進行相應的一些運算,但是這樣的運算存在一個侷限性,那就是我們一般在JVM執行過程中初始的記憶體是有限的,這樣如果全部在JVM記憶體中進行計算的話,很容易出現記憶體空間不足導致的OOM異常,那麼我們今天來介紹一種拓展性更強的方式來進行這樣的一些交併補的運算:通過Redis來實現資料的交集、並集、補集
Redis版本: Redis 6.0.6
Jedis版本: 4.2.2
工具類hutool版本: 5.8.0.M3
pom檔案:
<dependencies> <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <version>4.2.2</version> </dependency> <dependency> <groupId>cn.hutool</groupId> <artifactId>hutool-all</artifactId> <version>5.8.0.M3</version> </dependency></dependencies>
public class RedisCalculateUtils { static String oneFileString = "/Users/tmp/test-1.txt"; static String twoFileString = "/Users/tmp/test-2.txt"; static String diffFileString = "/Users/tmp/diff-test.txt"; static String interFileString = "/Users/tmp/inter-test.txt"; static String unionFileString = "/Users/tmp/union-test.txt"; static String oneFileCacheKey = "oneFile"; static String twoFileCacheKey = "twoFile"; static String diffFileCacheKey = "diffFile"; static String interFileCacheKey = "interFile"; static String unionFileCacheKey = "unionFile"; }
/** * 初始化資料並寫入檔案中 */public static void writeFile() { File oneFile = new File(oneFileString); List<String> fs = new ArrayList<>(10000); for (int i = 10000; i < 15000; i++) { String s = SecureUtil.md5(String.valueOf(i)); fs.add(s); } FileUtil.writeUtf8Lines(fs, oneFile); File twoFile = new File(twoFileString); fs.clear(); for (int i = 12000; i < 20000; i++) { String s = SecureUtil.md5(String.valueOf(i)); fs.add(s); } FileUtil.writeUtf8Lines(fs, twoFile); }
/** * 讀取檔案資料並寫入Redis */public static void writeCache() { try(Jedis jedis = new Jedis("127.0.0.1", 6379)) { Pipeline p = jedis.pipelined(); List<String> oneFileStringList = FileUtil.readLines(oneFileString, "UTF-8"); for (String s : oneFileStringList) { p.sadd(oneFileCacheKey, s); } p.sync(); List<String> twoFileStringList = FileUtil.readLines(twoFileString, "UTF-8"); for (String s : twoFileStringList) { p.sadd(twoFileCacheKey, s); } p.sync(); } catch (Exception e) { throw new RuntimeException(e); }}
/** * oneKey對應的Set 與 twoKey對應的Set 的差集 並寫入 threeKey * @param oneKey 差集前面的集合Key * @param twoKey 差集後面的集合Key * @param threeKey 差集結果的集合Key */ public static void diff(String oneKey, String twoKey, String threeKey) { try(Jedis jedis = new Jedis("127.0.0.1", 6379)) { long result = jedis.sdiffstore(threeKey, oneKey, twoKey); System.out.println("oneKey 與 twoKey 的差集的個數:" + result); } catch (Exception e) { throw new RuntimeException(e); } }
/** * 將計算的差集資料寫入到指定檔案 */ public static void writeDiffToFile() { File diffFile = new File(diffFileString); try(Jedis jedis = new Jedis("127.0.0.1", 6379)) { Set<String> result = jedis.smembers(diffFileCacheKey); FileUtil.writeUtf8Lines(result, diffFile); } catch (Exception e) { throw new RuntimeException(e); } }
/** * * @param cacheKeyArray 交集集合Key * @param destinationKey 交集集合結果Key */ public static void inter(String[] cacheKeyArray, String destinationKey) { try(Jedis jedis = new Jedis("127.0.0.1", 6379)) { long result = jedis.sinterstore(destinationKey, cacheKeyArray); System.out.println("cacheKeyArray 的交集的個數:" + result); } catch (Exception e) { throw new RuntimeException(e); } }
/** * 將計算的交集資料寫入到指定檔案 */ public static void writeInterToFile() { File interFile = new File(interFileString); try(Jedis jedis = new Jedis("127.0.0.1", 6379)) { Set<String> result = jedis.smembers(interFileCacheKey); FileUtil.writeUtf8Lines(result, interFile); } catch (Exception e) { throw new RuntimeException(e); } }
/** * 計算多個Key的並集並寫入到新的Key * @param cacheKeyArray 求並集的Key * @param destinationKey 並集結果寫入的KEY */ public static void union(String[] cacheKeyArray, String destinationKey) { try(Jedis jedis = new Jedis("127.0.0.1", 6379)) { long result = jedis.sunionstore(destinationKey, cacheKeyArray); System.out.println("cacheKeyArray 的並集的個數:" + result); } catch (Exception e) { throw new RuntimeException(e); } }
/** * 將計算的並集資料寫入到指定檔案 */ public static void writeUnionToFile() { File unionFile = new File(unionFileString); try(Jedis jedis = new Jedis("127.0.0.1", 6379)) { Set<String> result = jedis.smembers(unionFileCacheKey); FileUtil.writeUtf8Lines(result, unionFile); } catch (Exception e) { throw new RuntimeException(e); } }
舉例說明:
key1 = {a,b,c,d} key2 = {c} key3 = {a,c,e} SDIFF key1 key2 key3 = {b,d}
SDIFFSTORE 命令的作用和SDIFF類似,不同的是它將結果儲存到 destination 集合,而把結果集返回給使用者端。
如果 destination 集合已經存在,則將其覆蓋。
舉例說明:
key1 = {a,b,c,d} key2 = {c} key3 = {a,c,e} SINTER key1 key2 key3 = {c}
SINTERSTORE 命令與 SINTER 命令類似,不同的是它並不是直接返回結果集,而是將結果儲存在 destination 集合中。
如果 destination 集合存在, 則會被覆蓋。
舉例說明:
key1 = {a,b,c,d} key2 = {c} key3 = {a,c,e} SUNION key1 key2 key3 = {a,b,c,d,e}
SUNIONSTORE 命令的功能類似於 SUNION,不同的是不反回結果集,而是儲存在 destination 中。
如果 destination 已經存在,則被覆蓋。
推薦學習:
以上就是範例詳解Redis實現資料的交集、並集和補集的詳細內容,更多請關注TW511.COM其它相關文章!