掐指算一算 发表于 2022-2-27 22:31:07

0出现的次数更多,为什么0不是关键字呢?
我这样说不是抬杠,只是想让楼主说明一下,至少得有点能让电脑明白的规则吧!
这么多文字,这么多组合,不可能大海捞针去一一筛选吧。

漸行漸遠漸無 发表于 2022-3-1 11:56:26

您这么说也对,主要还是提取汉字的关键字,如果提取不对,还是需要人工介入。

珺珺 发表于 2022-3-3 01:13:10

不太对,手套这个关键字其实是未知的。就是因为A列里手套重复了很多次,才提取出“手套”这个关键字。

那时天蓝风暖 发表于 2022-3-7 22:59:53

明白了,就是A列中哪个关键字(要文字,数值型的不算)出现的次数最多就提取出来

苟活 发表于 2022-3-17 06:46:11

是的,是的。

大灰鸽 发表于 2022-3-21 03:12:07

汉字数万个,各种组合就更是不计其数了,怎么来确定谁跟谁组合,组合的字符串是多长?建议是你至少给个范围,比如可能会出现哪些词组,你把这些词组列个列表,然后从你给出的这些词组里边找!!

听风问雨 发表于 2022-3-27 03:25:08

=MID(TEXTJOIN("",1,$A$2:$A$12),MODE(IFERROR(MATCH(IF(MID(TEXTJOIN("",1,$A$2:$A$12),ROW($1:$211),1)>="Z",MID(TEXTJOIN("",1,$A$2:$A$12),ROW($1:$211),1),),IF(MID(TEXTJOIN("",1,$A$2:$A$12),ROW($1:$211),1)>="Z",MID(TEXTJOIN("",1,$A$2:$A$12),ROW($1:$211),1),),),"")),2)三键结束,公式长了点,还有个更长的能规避掉最后取数的长度的问题。

子豪的世界 发表于 2022-3-27 15:14:36

哈,之前我也是人工取过关键字,但是未来数据量大了之后可能工作量会很大。

胡成升 发表于 2022-3-28 05:58:26

哈,之前我也是人工取过关键字,但是未来数据量大了之后可能工作量会很大。
页: 1 2 [3]
查看完整版本: 如何提取多次重复的文字为关键字