在早期的linux内核版本的时间概念都是由周期时钟提供的。虽然比较有效,但是,对于关注能耗电量的系统上,就不能满足长时间休眠的需求,因为周期系统要求必须在一定的频率下,周期性的处于活动状态。因此,linux提出了tickless system,即无时钟系统。其关键就是判定系统当前是否无事可做,若是则禁用时钟系统。判定系统当前无事可做的依据是:如果运行队列时没有活动进程,内核将选择idle进程来运行,而此时动态时钟发挥作用。
一、动态时钟使用的数据结构tick_sched
点击(此处)折叠或打开
-
struct tick_sched {
-
struct hrtimer sched_timer;//用于实现时钟的定时器
-
unsigned long check_clocks;
-
enum tick_nohz_mode nohz_mode;
-
ktime_t idle_tick;//禁用周期时钟之前,上一个时钟信号到期时间。
-
int inidle;
-
int tick_stopped;//周期时钟是否已经停用,若停用,则置为1
-
unsigned long idle_jiffies;//存储周期时钟禁用时的jiffy值
-
unsigned long idle_calls;//内核试图停用周期时钟次数。
-
unsigned long idle_sleeps;//成功停用周期时钟次数。
-
int idle_active;
-
ktime_t idle_entrytime;
-
ktime_t idle_waketime;
-
ktime_t idle_exittime;
-
ktime_t idle_sleeptime;//周期时钟上一次禁用的准确时间
-
ktime_t idle_lastupdate;
-
ktime_t sleep_length;//周期时钟禁用的时间长度
-
unsigned long last_jiffies;
-
unsigned long next_jiffies;//下一个定时器到期的jiffy值
-
ktime_t idle_expires;//下一个将到期的经典定时器到期时间的jiffy值
-
int do_timer_last;
- }
二、低分辨率下的动态时钟
每个定时软中断中会判断是否启用动态时钟,具体调用序列如下:
run_timer_softirq--》hrtimer_run_pending--》tick_check_oneshot_change--》tick_nohz_switch_to_nohz
而其tick_nohz_switch_to_nohz具体实现如下:
点击(此处)折叠或打开
-
static void tick_nohz_switch_to_nohz(void)
-
{
-
struct tick_sched *ts = &__get_cpu_var(tick_cpu_sched);
-
ktime_t next;
-
-
if (!tick_nohz_enabled)//若没有启动动态时钟直接返回
-
return;
-
-
local_irq_disable();
-
if (tick_switch_to_oneshot(tick_nohz_handler)) {//切换时钟设备的处理函数为tick_nohz_switch_to_nohz
-
local_irq_enable();
-
return;
-
}
-
-
ts->nohz_mode = NOHZ_MODE_LOWRES;//设置为低分辨率
-
-
/*
-
* Recycle the hrtimer in ts, so we can share the
-
* hrtimer_forward with the highres code.
- */
-
//更新jiffy值
-
hrtimer_init(&ts->sched_timer, CLOCK_MONOTONIC, HRTIMER_MODE_ABS);
-
/* Get the next period */
-
next = tick_init_jiffy_update();
-
//设置下一个时钟事件
-
for (;;) {
-
hrtimer_set_expires(&ts->sched_timer, next);
-
if (!tick_program_event(next, 0))
-
break;
-
next = ktime_add(next, tick_period);
-
}
-
local_irq_enable();
-
-
printk(KERN_INFO "Switched to NOHz mode on CPU #%d\n",
-
smp_processor_id());
- }
动态时钟处理程序tick_nohz_handler的实现如下:
点击(此处)折叠或打开
-
static void tick_nohz_handler(struct clock_event_device *dev)
-
{
-
struct tick_sched *ts = &__get_cpu_var(tick_cpu_sched);
-
struct pt_regs *regs = get_irq_regs();
-
int cpu = smp_processor_id();
-
ktime_t now = ktime_get();
-
-
dev->next_event.tv64 = KTIME_MAX;
-
-
//设置当前cpu负责全局时钟设备
-
if (unlikely(tick_do_timer_cpu == TICK_DO_TIMER_NONE))
- tick_do_timer_cpu = cpu;
-
-
//若是全局时钟设备,则更新jiffy值
-
if (tick_do_timer_cpu == cpu)
-
tick_do_update_jiffies64(now);
-
//若是启动禁用全局时钟,则更新watchdog的时间戳
-
if (ts->tick_stopped) {
-
touch_softlockup_watchdog();
-
ts->idle_jiffies++;
-
}
-
-
update_process_times(user_mode(regs));
-
profile_tick(CPU_PROFILING);
-
//定时下一个时钟周期,并且更新jiffy
-
while (tick_nohz_reprogram(ts, now)) {
-
now = ktime_get();
-
tick_do_update_jiffies64(now);
-
}
- }
更新jiffy值tick_do_update_jiffies64得具体实现如下:
点击(此处)折叠或打开
-
static void tick_do_update_jiffies64(ktime_t now)
-
{
-
......
-
//更新经过的jiffy时间,判断是否在一个周期内,若是则直接返回
-
delta = ktime_sub(now, last_jiffies_update);
-
if (delta.tv64 < tick_period.tv64)
-
return;
-
-
//计算经过的jiffy差值,判断是否大于一个周期,若是大于,则先更新一个周期的jiffy值
-
delta = ktime_sub(now, last_jiffies_update);
-
if (delta.tv64 >= tick_period.tv64) {
-
-
delta = ktime_sub(delta, tick_period);
-
last_jiffies_update = ktime_add(last_jiffies_update,
-
tick_period);
-
//若是大于一个周期,则再计算差值,再加上这个差值的jiffy值
-
/* Slow path for long timeouts */
-
if (unlikely(delta.tv64 >= tick_period.tv64)) {
-
s64 incr = ktime_to_ns(tick_period);
-
-
ticks = ktime_divns(delta, incr);
-
-
last_jiffies_update = ktime_add_ns(last_jiffies_update,
-
incr * ticks);
-
}
-
do_timer(++ticks);
-
//更新下一个周期的jiffy值
-
/* Keep the tick_next_period variable up to date */
-
tick_next_period = ktime_add(last_jiffies_update, tick_period);
-
}
-
write_sequnlock(&xtime_lock);
- }
三、高分辨率下的动态时钟
高分辨率下的动态时钟实现比较容易,具体涉及的地方如下:
1、确定全局时钟的责任,在tick_sched_timer中,如下:
点击(此处)折叠或打开
-
#ifdef CONFIG_NO_HZ
-
/*
-
* Check if the do_timer duty was dropped. We don't
care about -
* concurrency: This happens only when the cpu in charge went
-
* into a long sleep. If two cpus happen to assign
themself to -
* this duty, then the jiffies update is still
serialized by -
* xtime_lock.
-
*/
-
if (unlikely(tick_do_timer_cpu == TICK_DO_TIMER_NONE))
-
tick_do_timer_cpu = cpu;
- #endif
2、宣布高精度定时器下启用动态时钟,在tick_setup_sched_timer函数中,如下:
点击(此处)折叠或打开
-
#ifdef CONFIG_NO_HZ
-
if (tick_nohz_enabled)
-
ts->nohz_mode = NOHZ_MODE_HIGHRES;
- #endif
三、前面介绍的是在高低分辨率情况下,对动态时钟的支持,也即如何做一些更新jiffy类的操作。那么,何时启用和禁止时钟呢?前面已经说过,就是在idle任务中完成这样的操作,因为各个架构内容不同,但原理类似。我们举x86下面的实现片段,如下:
点击(此处)折叠或打开
-
void cpu_idle(void)
- {
- ......
-
-
/* endless idle loop with no priority at all */
-
while (1) {
-
tick_nohz_stop_sched_tick(1);//停止时钟
-
while (!need_resched()) {
- ......
- //pm_idle的实现依赖具体架构而定,x86支持的一种实现是mwait实现,这种实现真正的是haunt住cpu,cpu切实不运转了,可以实现节能的目的,而ARM上可以使用wfi指令,cpu也haunt住,通过中断可以唤醒。
-
/* Don't trace irqs off for idle */
-
stop_critical_timings();
-
pm_idle();//节能的关键部分
-
start_critical_timings();
-
}
-
tick_nohz_restart_sched_tick();//启动时钟
-
preempt_enable_no_resched();
-
schedule();//调度切换
-
preempt_disable();
-
}
- }
而停止时钟tick_nohz_stop_sched_tick的本质实现:检查下一个定时器事件是否在一个时钟之后,若是,则重新编程时钟设备,忽略下一个时钟周期信号,直至有必要时候才恢复,而且在tick_sched中更新统计信息。重启时钟的原理也很简单,在此不再累述。
四、介绍一下广播模式
在某些省电模式启用时,时候总时间设备进入睡眠,而系统中不只有一个时钟事件设备,仍然可用另一个可工作的设备替换停止设备。在这种情况下,APIC是不工作的,但广播设备仍然可以工作,tick_handle_periodic_broadcast用作事件处理程序,该程序在每个tick_period之后。下面介绍tick_handle_periodic_broadcast的具体实现,如下:
点击(此处)折叠或打开
-
static void tick_handle_periodic_broadcast(struct clock_event_device *dev)
-
{
-
ktime_t next;
-
-
tick_do_periodic_broadcast();
-
-
/*
-
* The device is in periodic mode. No
reprogramming necessary: -
*/
-
if (dev->mode == CLOCK_EVT_MODE_PERIODIC)//必须为oneshot模式
-
return;
-
-
/*
-
* Setup the next period for devices, which do not have
-
* periodic mode. We read dev->next_event
first and add to it -
* when the event alrady expired. clockevents_program_event()
-
* sets dev->next_event only when the event is really
-
* programmed to the device.
-
*/
-
for (next = dev->next_event; ;) {
-
next = ktime_add(next, tick_period);
-
//重新编程下一个事件
-
if (!clockevents_program_event(dev, next, ktime_get()))
-
return;
-
tick_do_periodic_broadcast();//处理本cpu事件和向其他cpu发送ipi中断,从而调用其他cpu的事件处理程序
-
}
- }
tick_do_periodic_broadcast --》tick_do_broadcast ,而tick_do_broadcast是关键,其实现如下:
点击(此处)折叠或打开
-
static void tick_do_broadcast(struct cpumask *mask)
-
{
-
int cpu = smp_processor_id();
-
struct tick_device *td;
-
-
//调用本cpu的事件处理程序
-
if (cpumask_test_cpu(cpu, mask)) {
-
cpumask_clear_cpu(cpu, mask);
-
td = &per_cpu(tick_cpu_device, cpu);
-
td->evtdev->event_handler(td->evtdev);
-
}
-
-
if (!cpumask_empty(mask)) {
-
//向其他cpu发送ipi中断
-
td = &per_cpu(tick_cpu_device, cpumask_first(mask));
-
td->evtdev->broadcast(mask);
-
}
- }
向其他cpu发送ipi中断实现如下:
点击(此处)折叠或打开
-
static void lapic_timer_broadcast(const struct cpumask *mask)
-
{
-
#ifdef CONFIG_SMP
-
apic->send_IPI_mask(mask, LOCAL_TIMER_VECTOR);
-
#endif
- }
最终ipi中断导致其他cpu调用本cpu的时钟事件设备的处理函数。