使用python对kafka offset 进行监控-白红宇

使用python对kafka offset 进行监控

阅读量：6138 次

发布时间：2019-06-21

本文共 7798 字，大约阅读时间需要 25 分钟。

1.由于kafka 的offset存储方式改变,支持之前的zookeeper和现在的kafka内部存储机制2.实在没找到怎么获取kafka 内部存储的消费组,所以不能和zk里一样,能全部查出消费组,配置需要监控的消费组配置如下

# 监控的topictopics = ['test_topic']# 要监控的groupidmonitor_group_ids = ['consumer_1']# broker-listservers = 'localhost:9092'# mysql argsdbargs = {'user': 'root', 'password': '1234', 'host': 'localhost', 'database': 'test'}# 监控数据上报间隔 秒time_interval = 2.5# 历史全量数据上报间隔history_time_interval = 5 * 60

# -*- coding:utf-8 -*-import timeimport sysfrom kafka.client import KafkaClientfrom kafka.protocol.commit import OffsetFetchRequest_v1, OffsetFetchResponse_v1, OffsetFetchRequest_v0, \    OffsetFetchResponse_v0from kafka.protocol.offset import OffsetRequest_v0, OffsetResponse_v0from mysql import connectorfrom sqlalchemy.engine import create_enginefrom sqlalchemy.orm import create_sessionfrom monitor_constants import *duration = 0client = Noneconn = Nonepartition_cache = {}brokers_cache = []kafka_type = []zk_type = []insert_sql = ("INSERT INTO consumer_monitor "              "(group_id, topic, `partition`, `offset`, logsize, create_time) "              "VALUES (:group_id,:topic,:partition,:offset,:logsize,:create_time)")history_insert_sql = ("INSERT INTO consumer_monitor_history "                      "(group_id, topic, `partition`, `offset`, logsize, create_time) "                      "VALUES (:group_id,:topic,:partition,:offset,:logsize,:create_time)")select_sql = ("select count(1) "              "from consumer_monitor "              "where group_id=:group_id and topic=:topic and `partition`=:partition")update_sql = ("update consumer_monitor "              "set `offset`=:offset,logsize=:logsize,create_time=:create_time "              "where group_id=:group_id and topic=:topic and `partition`=:partition")def get_brokers():    if not brokers_cache:        brokers = client.cluster.brokers()        if brokers:            brokers_cache.extend([x.nodeId for x in brokers])    return brokers_cachedef get_partitions(topic):    if not partition_cache or topic not in partition_cache:        partitions = client.cluster.available_partitions_for_topic(topic)        if partitions:            partition_cache[topic] = [x for x in partitions]        else:            return []    return partition_cache[topic]def get_logsize():    """        获取topic 下每个partition的logsize(各个broker的累加)    :return:    """    tp = {}  # topic : partition_dict    brokers = get_brokers()    for topic in topics:        partitions = get_partitions(topic)        pl = {}  # partition : logsize        for broker in brokers:            # 这里取笛卡尔积可能有问题,但是不影响parse中解析了            for partition in partitions:                client.send(broker, OffsetRequest_v0(replica_id=-1, topics=[(topic, [(partition, -1, 1)])]))                responses = client.poll()                pdict = parse_logsize(topic, partition, responses)                append(pl, pdict)        tp[topic] = pl    return tpdef append(rdict, pdict):    if rdict:        # 已经有记录,累加        for k, v in pdict.items():            if k in rdict:                rdict[k] = rdict[k] + v            else:                rdict[k] = v    else:        rdict.update(pdict)def parse_logsize(t, p, responses):    """        单个broker中单个partition的logsize    :param responses:    :param p:    :param t:    :return:    """    for response in responses:        if not isinstance(response, OffsetResponse_v0):            return {}        tps = response.topics        topic = tps[0][0]        partition_list = tps[0][1]        partition = partition_list[0][0]        # 异步poll来的数据可能不准        if topic == t and partition == p and partition_list[0][1] == 0:            logsize_list = partition_list[0][2]            logsize = logsize_list[0]            return {partition: logsize}    return {}def parse_offsets(t, responses):    dr = {}    for response in responses:        if not isinstance(response, (OffsetFetchResponse_v1, OffsetFetchResponse_v0)):            return {}        tps = response.topics        topic = tps[0][0]        partition_list = tps[0][1]        if topic == t:            for partition_tunple in partition_list:                if partition_tunple[3] == 0:                    offset = partition_tunple[1]                    dr[partition_tunple[0]] = offset    return drdef get_offsets():    # {gid: dict}    gd = {}    for gid in monitor_group_ids:        td = {}  # {topic:dict}        for topic in topics:            pd = {}  # {partition:dict}            for broker in get_brokers():                partitions = get_partitions(topic)                if not partitions:                    return {}                else:                    responses = optionnal_send(broker, gid, topic, partitions)                    dr = parse_offsets(topic, responses)                    append(pd, dr)            td[topic] = pd        gd[gid] = td    return gddef optionnal_send(broker, gid, topic, partitions):    if gid in kafka_type:        return kafka_send(broker, gid, topic, partitions)    elif gid in zk_type:        return zk_send(broker, gid, topic, partitions)    else:        responses = zk_send(broker, gid, topic, partitions)        dct = parse_offsets(topic, responses)        if is_suitable(dct):            zk_type.append(gid)            return responses        responses = kafka_send(broker, gid, topic, partitions)        dct = parse_offsets(topic, responses)        if is_suitable(dct):            kafka_type.append(gid)        return responsesdef is_suitable(dct):    for x in dct.values():        if x != -1:            return Truedef kafka_send(broker, gid, topic, partitions):    client.send(broker, OffsetFetchRequest_v1(consumer_group=gid, topics=[(topic, partitions)]))    return client.poll()def zk_send(broker, gid, topic, partitions):    client.send(broker, OffsetFetchRequest_v0(consumer_group=gid, topics=[(topic, partitions)]))    return client.poll()def initdb():    try:        config_url = 'mysql+mysqlconnector://' + dbargs['user'] + ':' + dbargs['password'] + '@' + dbargs[            'host'] + '/' + dbargs['database'] + '?charset=utf8'        engine = create_engine(config_url, echo=False, pool_recycle=4)        return create_session(bind=engine, autocommit=False)    except connector.Error as e:        print e        sys.exit(1)def exec_sql(sql, param):    try:        result = conn.execute(sql, param)        conn.commit()        conn.close()        return result.rowcount    except Exception as e:        try:            conn.rollback()            conn.close()        except Exception as ex:            print ex        print edef store_db(param):    dr = {'group_id': param[0], 'topic': param[1], 'partition': param[2], 'offset': param[3], 'logsize': param[4],          'create_time': param[5]}    global duration    if duration >= history_time_interval:        exec_sql(history_insert_sql, dr)        duration = 0    exist = exec_sql(select_sql, {'group_id': param[0], 'topic': param[1], 'partition': param[2]})    if exist and exist != 0:        exec_sql(update_sql, dr)    else:        exec_sql(insert_sql, dr)def do_task():    offset_dict = get_offsets()    logsize_dict = get_logsize()    for gk, gv in offset_dict.items():        for tk, tv in gv.items():            for pk, pv in tv.items():                if logsize_dict and tk in logsize_dict:                    dr = logsize_dict[tk]  # partition:logsize                    if dr and pk in dr:                        param = (gk, tk, pk, pv, dr[pk],                                 time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(time.time())))                        store_db(param)if __name__ == "__main__":    conn = initdb()    client = KafkaClient(bootstrap_servers=servers, request_timeout_ms=3000)    while True:        do_task()        time.sleep(time_interval)        duration += time_interval

转载于:https://my.oschina.net/ktlb/blog/863308

你可能感兴趣的文章

在命令行中运行“mvn compile”因为中文报错

查看>>

Docker的技术不再局限于测试和开发

查看>>

技术干货：工欲善其事，必先利其器阿里云数据库系列谈之一