Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

当服务器cpu满的时候,nacos集群不生效 #10152

Closed
ccx1 opened this issue Mar 21, 2023 · 13 comments
Closed

当服务器cpu满的时候,nacos集群不生效 #10152

ccx1 opened this issue Mar 21, 2023 · 13 comments
Labels
status/invalid This doesn't seem right

Comments

@ccx1
Copy link

ccx1 commented Mar 21, 2023

我的nacos服务一共3个节点,当一个节点磁盘满导致nacos日志无法正常写入,cpu会飙升至99.98%,此时我的所有服务(也是集群)不断处于上线,下线,上线的状态,从nacos的服务列表中表象来看目前是这样,请问这个是否会有这样的情况

@KomachiSion
Copy link
Collaborator

cpu跑满,肯定存在资源争抢, 大量心跳无法处理,有上下线是正常的。

@yuyijq
Copy link
Contributor

yuyijq commented Mar 21, 2023

@ccx1 @KomachiSion 这个问题跟我提的 #10148 问题是一样的
问题并不是说CPU跑满的问题,问题是为啥一个节点出问题,要影响一个集群

@ccx1
Copy link
Author

ccx1 commented Mar 21, 2023

如何去规避,以及nacos的日志配置是否有可以配置的地方,比如设置时限。并不需要我们人为的去删除或者配置脚本,更希望通过配置项去解决这方面的问题

@KomachiSion
Copy link
Collaborator

这一个节点cpu慢了, 会导致其他节点向这个节点的探测时好时坏,相当于有个server节点不停的入集群,出集群,长期这样肯定会影响数据同步,责任节点计算等等。

@KomachiSion
Copy link
Collaborator

这一个节点cpu慢了, 会导致其他节点向这个节点的探测时好时坏,相当于有个server节点不停的入集群,出集群,长期这样肯定会影响数据同步,责任节点计算等等。

如何去规避,以及nacos的日志配置是否有可以配置的地方,比如设置时限。并不需要我们人为的去删除或者配置脚本,更希望通过配置项去解决这方面的问题

nacos/conf/nacos-logback.xml

@KomachiSion
Copy link
Collaborator

出现问题最好先从集群摘除节点或者彻底停止,让其他节点处于稳定状态, 再去修复有问题节点。

@985492783
Copy link
Contributor

@ccx1 @KomachiSion 这个问题跟我提的 #10148 问题是一样的 问题并不是说CPU跑满的问题,问题是为啥一个节点出问题,要影响一个集群

我理解集群要保证一致性,一个节点日志写不了那所有节点都失败,否则节点和节点的日志都不一样

@yuyijq
Copy link
Contributor

yuyijq commented Mar 21, 2023

@ccx1 @KomachiSion 这个问题跟我提的 #10148 问题是一样的 问题并不是说CPU跑满的问题,问题是为啥一个节点出问题,要影响一个集群

我理解集群要保证一致性,一个节点日志写不了那所有节点都失败,否则节点和节点的日志都不一样

这个日志是程序的logback日志吧,不是raft日志吧,这种日志为啥要一致

@yuyijq
Copy link
Contributor

yuyijq commented Mar 23, 2023

@KomachiSion hi,请问现在可以通过什么方式不停止节点而摘除节点啊,我发现之前有个/leave的接口给干了...

@KomachiSion
Copy link
Collaborator

改cluster.conf文件, 这个文件动态读取的

@guozongkang
Copy link
Contributor

改cluster.conf文件, 这个文件动态读取的

问题是nacos不是会把节点信息存放在data目录下么? 你就算改了cluster.conf文件,旧的IP已经被存储了,它还是会去找那个节点啊

@KomachiSion
Copy link
Collaborator

不会,cluster.conf修改, 读取到之后会把下线的ip移除掉,

可以读一下ServerMemberManager和对应的LookUp

@KomachiSion
Copy link
Collaborator

No more response from author, I think this is a usage problem.

@KomachiSion KomachiSion closed this as not planned Won't fix, can't repro, duplicate, stale Mar 31, 2023
@KomachiSion KomachiSion added status/invalid This doesn't seem right and removed status/need feedback labels Mar 31, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
status/invalid This doesn't seem right
Projects
None yet
Development

No branches or pull requests

5 participants