如何判断一个序列中有几个连续的数字？

liuyalong008 · 发表于 2014-10-29 20:47:29

在matlab中文论坛发现一个问题，觉得挺有意思，大家可以探讨一下：
假如有一个数组[1,0,0,1,1,1,1,0,1,1,1,0,0,0,1]‘这样的
那怎样用matlab编程判断有连续3个以上的1所在的地方？

winner245给出了不错的solution，

k = find(diff([0,m,0])).';
g = find(k(2:2:end)- k(1:2:end)>=3);
[k(2*g-1),k(2*g)-1]

复制代码

我也抛砖引玉一个：

y=regexprep(num2str(m),' ','')
[a,b] = regexp(y,'1{3,}','match')
[b;b+cellfun(@numel,a)-1]

复制代码

那么问题就来了：
1：如果需要要求的不仅仅是1，是其他数字如：

m = [1,0,0,1,1,1,1,0,2,2,2,0,0,]

复制代码

需要判断连续的数字，该如何判断？
2：
如果再有所变化：

m = [1,0,0,1,1,1,1,0,2,2,2,0,0,0,2345,2345,2345,2345,2345]

复制代码

改如何找出 1，连续的数值；2、数据的位置；3、数据的个数

nwcwww · 发表于 2014-10-30 02:07:14

抛砖引玉：

m = [1,0,0,1,1,1,1,0,2,2,2,0,0,0,2345,2345,2345,2345,2345];
cc = regexp(sprintf('%d ', m), '\<(\d+\s)\1*', 'match');
RunLength = cellfun('length', regexp(cc, ' '));
RunLengthCumSum = [0 cumsum(RunLength)];
IfValid = cellfun('isempty', regexp(cc, '^0')) & RunLength>2;
StartEnd = [RunLengthCumSum(IfValid)+1; RunLengthCumSum([ false IfValid])]
ValueList = m(StartEnd(1, :))

复制代码

StartEnd =
4 9 15
7 11 19
ValueList =
1 2 2345

复制代码

nwcwww · 发表于 2014-10-30 02:14:46

之前那个全是1或0的也可以不用cellfun:

m = [1,0,0,1,1,1,1,0,1,1,1,0,0,0,1];
[cc,dd] = regexp(sprintf('%d', m), '1{3,}', 'start', 'end');
[cc;dd]

复制代码

rocwoods · 发表于 2014-10-30 14:39:11

m ~=0;
regionprops(m,'Area','PiexlIDlist')；
简单直接，二维的一样适用。

winner245 · 发表于 2014-10-30 21:39:17

看了各位的解答确实大开眼界！我还是继续给出老土的 diff 解决方法：

reshape(find(diff([0 ~diff(m) 0])),2,[])

与诸位不同的是，此法可以把连续的0的位置也找出来（即不仅仅是找连续非0元素，这也是 ljelly 老兄提到的情形）

winner245 · 发表于 2014-10-30 22:33:06

如果仅仅限制在找非0连续元素，那么 diff 方法至少有两种修改方法：

1. 预处理法

m = [1,0,0,1,1,1,1,0,2,2,2,0,0,0,2345,2345,2345,2345,2345];
id = m==0;
m(id) = rand(1,sum(id));
k = reshape(find(diff([0 ~diff(m) 0])),2,[])
m(k(1,:))

复制代码

k =
   4    9 15
   7 11 19

ans =
         1          2       2345

2. 后修正法

m = [1,0,0,1,1,1,1,0,2,2,2,0,0,0,2345,2345,2345,2345,2345];
k = reshape(find(diff([0 ~diff(m) 0])),2,[])
id = m(k(1,:))~=0;
k(:,id)
m(k(1,id))

复制代码

k =
   4    9 15
   7 11 19

ans =
         1          2       2345

winner245 · 发表于 2014-10-31 00:21:11

本帖最后由 winner245 于 2014-10-31 04:05 编辑

刚才我在 5L、6L 考虑的是任意连续数字情形，并没有规定连续数字的个数 >= 3，只是找出连续的数值（这是MATLAB中文论坛最近另一个帖子的问题：http://ilovematlab.cn/thread-308583-1-1.html ）。

如果加上连续元素个数 >= 3 的限制，我还是先一如既往 diff 到底（对5L、6L代码修改如下）：

1. 连续0元素计入在内：

m = [1,0,0,1,1,1,1,0,2,2,2,0,0,0,2345,2345,2345,2345,2345]
k = reshape(find(diff([0 ~diff(m) 0])),2,[]);
k = k(:,diff(k)>=2)
m(k(1,:))

复制代码

k =
   4    9 12 15
   7 11 14 19

ans =
         1          2          0       2345

2. 仅考虑非0连续元素：

m = [1,0,0,1,1,1,1,0,2,2,2,0,0,0,2345,2345,2345,2345,2345];
k = reshape(find(diff([0 ~diff(m) 0])),2,[]);
k = k(:,diff(k)>=2 & m(k(1,:))~=0)
m(k(1,:))

复制代码

k =
   4    9 15
   7 11 19

ans =
         1          2       2345

受两位版主启发，可以将 diff 和 regexp 结合使用
1. 连续0元素计入在内：

m = [1,0,0,1,1,1,1,0,2,2,2,0,0,0,2345,2345,2345,2345,2345];
[c,d] = regexp(sprintf('%d', ~diff(m)), '1{2,}');
[c;d+1]
m(c)

复制代码

ans =
   4    9 12 15
   7 11 14 19

ans =
         1          2          0       2345

2. 仅考虑非0连续元素：

m = [1,0,0,1,1,1,1,0,2,2,2,0,0,0,2345,2345,2345,2345,2345];
[c,d] = regexp(sprintf('%d', ~diff(m)), '1{2,}');
id = m(c)~=0;
[c(id);d(id)+1]
m(c(id))

复制代码

ans =
   4    9 15
   7 11 19

ans =
         1          2       2345

winner245 · 发表于 2014-10-31 04:06:46

等效的 diff + regexp 法：

>> m = [1,0,0,1,1,1,1,0,2,2,2,0,0,0,2345,2345,2345,2345,2345];
>> [c,d] = regexp(sprintf('%d', abs(diff(m))), '0{2,}');
>> [c;d+1] % 连续0元素计入在内
>> m(c)
>> id = m(c)~=0;  % 仅考虑连续非0元素
>> [c(id);d(id)+1]
>> m(c(id))

ans =
   4    9 12 18
   7 11 14 22

ans =
         1          2          0       2345

ans =
   4    9 18
   7 11 22

ans =
         1          2       2345

liuyalong008 · 发表于 2014-11-1 22:45:18

题目已经贴在了matlab cody上面了
大家可以贴一下，也可以看看别人的解法题目：2651

winner245 · 发表于 2014-11-2 08:25:12

liuyalong008 发表于 2014-11-1 22:45
题目已经贴在了matlab cody上面了
大家可以贴一下，也可以看看别人的解法题目：2651
...

不知道那个 size = 27 的代码怎么写出来的，我 beat 不了他所以看不见他的代码，我只能写到 29

x = [1,0,0,1,1,1,1,0,2,2,2,0,0,0,2345,2345,2345,2345,2345];
[a, b] = regexp(char(x), '(.)\1+');
y = [a; b; x(a)]

liuyalong008 · 发表于 2014-11-2 08:46:56

winner245 发表于 2014-11-2 08:25
不知道那个 size = 27 的代码怎么写出来的，我 beat 不了他所以看不见他的代码，我只能写到 29

x = [1,0 ...

[s, e] = regexp(char(x), '(.)\1+');
[s; e; x(s)];

复制代码

输出时用ans即可

winner245 · 发表于 2014-11-2 09:42:02

liuyalong008 发表于 2014-11-2 08:46
输出时用ans即可

你的意思是这个子函数写成：

function ans = successive_value(x)
[s, e] = regexp(char(x), '(.)\1+');
[s;e;x(s)];
end

日常生活中我倒是从来没想过这样写代码，不过，cody只以size大小衡量代码的优劣，这确实是一个减小size的技巧。

但就代码效率而言，这个size=27的代码，反倒不如我最初在5L给出的 size=37 的代码:

function main1
clear all
close all
clc
x = randi([0,100],1,1e5);
[timeit(@()fun1(x)); timeit(@()fun2(x))]
isequal(fun1(x),fun2(x))
end
function y = fun1(x)
a = reshape(find(diff([0 ~diff(x) 0])),2,[]);
y = [a; x(a(1,:))];
end
function ans = fun2(x)
[s, e] = regexp(char(x), '(.)\1+');
[s;e;x(s)];
end

复制代码

ans =
0.0008
0.0098

ans =
1
似乎，cody这种只注重代码size的方法不太科学。纯属个人愚见，感谢指点

liuyalong008 · 发表于 2014-11-2 10:58:44

winner245 发表于 2014-11-2 09:42
你的意思是这个子函数写成：

function ans = successive_value(x)

诚如君言，size评判有失偏颇，并且很多时候效率其实是优先考虑的，但是有时候在兼顾size的情况下也有很多巧妙和精彩的解法。也算是欣赏一下不同的技巧。
就此问题而言，老兄5L给出的solution应该差不多是最优的，估计没有太多其他算法出其右

账号		自动登录	找回密码
密码			注册

账号		自动登录	找回密码
密码			立即注册

如何判断一个序列中有几个连续的数字？

点评

点评

评分

点评

评分

点评

评分

点评

点评

点评